23
DALI Digits, architectures et logiciels informatiques 1 Présentation générale L’équipe DALI 1 développe une thématique de recherche unifiée afin d’améliorer la qualité nu- mérique et la haute performance des calculs. DALI permet l’interaction, rare en France au sein d’une même équipe, de chercheurs spécialisés en micro-architecture et en arithmétique des ordinateurs. Côté performances, nos travaux portent sur l’exploitation du potentiel de calcul toujours croissant des processeurs : élargissement des chemins (micro-architecture vectorielle), multiplication des cœurs (parallélisme de tâches), augmentation du parallélisme d’instructions. Côté arithmétique, la qualité numérique des applications de calcul scientifique ou des applications embarquées dépend crucialement de la maîtrise des effets de la précision finie et de l’arithmétique flottante en particulier. Il s’agit de contrôler et certifier les calculs (algorithmes, codes) mais aussi d’optimiser la précision des traitements. De nombreux logiciels, scientifiques ou embarqués, nécessitent d’améliorer la qualité numérique sans pour autant sacrifier la rapidité d’exécution ou le coût énergétique. Ainsi se rejoignent amélioration de la performance et de la qualité numérique. L’équipe est active et bien visible dans les communautés nationales scientifiques de l’informatique mathématique et de l’architecture des ordinateurs, et est très régulièrement impliquée dans les structures d’animation de la recherche de ces domaines. Les doctorants issus de DALI sont globalement recrutés avec succès dans des structures de recherche publiques ou privées, en France ou à l’étranger. L’équipe, composée d’enseignants-chercheurs de l’Université de Perpignan Via Domitia, est localisée sur la campus de Perpignan situé à 2 heures de transport du laboratoire. Elle relève de l’école doctorale de l’UPVD (ED305 énergie et environnement) et de ses programmes d’appui à la recherche (budget récurrent, appels BQR et PEPS). 2 Evolution de l’équipe Composition au 1er janvier 2017 : — 6 permanents : 2 PR1 (B. Goossens, Ph. Langlois), 2 MCF HDR (D. Defour, Ch. Negre), 2 MCF (D. Parello, G. Revy) — 1 assistante (S. Munoz, 50%) — 1 personnel statutaire chercheur associé (J.M. Robert, professeur agrégé, Béziers) — 1 post-doc (R. Nheili, ATER à 50%) — 3 doctorants (C. Chohra, H. de Lassus Saint-Geniès, K. Porada) 1. http:webdali.univ-perp.fr 161, rue Ada F - 34392 Montpellier Cedex 05 Tél. : 33 (0) 4 67 41 85 85 Fax : 33 (0) 4 67 41 85 00 www.lirmm.fr

DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

DALIDigits architectures et logiciels informatiques

1 Preacutesentation geacuteneacuterale

Lrsquoeacutequipe DALI 1 deacuteveloppe une theacutematique de recherche unifieacutee afin drsquoameacuteliorer la qualiteacute nu-meacuterique et la haute performance des calculs DALI permet lrsquointeraction rare en France au sein drsquounemecircme eacutequipe de chercheurs speacutecialiseacutes enmicro-architecture et en arithmeacutetique des ordinateurs

Cocircteacute performances nos travaux portent sur lrsquoexploitation du potentiel de calcul toujours croissantdes processeurs eacutelargissement des chemins (micro-architecture vectorielle) multiplication des cœurs(paralleacutelisme de tacircches) augmentation du paralleacutelisme drsquoinstructions Cocircteacute arithmeacutetique la qualiteacutenumeacuterique des applications de calcul scientifique ou des applications embarqueacutees deacutepend crucialementde la maicirctrise des effets de la preacutecision finie et de lrsquoarithmeacutetique flottante en particulier Il srsquoagit decontrocircler et certifier les calculs (algorithmes codes) mais aussi drsquooptimiser la preacutecision des traitementsDe nombreux logiciels scientifiques ou embarqueacutes neacutecessitent drsquoameacuteliorer la qualiteacute numeacuterique sanspour autant sacrifier la rapiditeacute drsquoexeacutecution ou le coucirct eacutenergeacutetique Ainsi se rejoignent ameacutelioration dela performance et de la qualiteacute numeacuterique

Lrsquoeacutequipe est active et bien visible dans les communauteacutes nationales scientifiques de lrsquoinformatiquematheacutematique et de lrsquoarchitecture des ordinateurs et est tregraves reacuteguliegraverement impliqueacutee dans lesstructures drsquoanimation de la recherche de ces domaines Les doctorants issus de DALI sont globalementrecruteacutes avec succegraves dans des structures de recherche publiques ou priveacutees en France ou agrave lrsquoeacutetranger

Lrsquoeacutequipe composeacutee drsquoenseignants-chercheurs de lrsquoUniversiteacute de Perpignan Via Domitia est localiseacuteesur la campus de Perpignan situeacute agrave 2 heures de transport du laboratoire Elle relegraveve de lrsquoeacutecole doctoralede lrsquoUPVD (ED305 eacutenergie et environnement) et de ses programmes drsquoappui agrave la recherche (budgetreacutecurrent appels BQR et PEPS)

2 Evolution de lrsquoeacutequipe

Composition au 1er janvier 2017 mdash 6 permanents 2 PR1 (B Goossens Ph Langlois) 2 MCF HDR (D Defour Ch Negre) 2

MCF (D Parello G Revy)mdash 1 assistante (S Munoz 50)mdash 1 personnel statutaire chercheur associeacute (JM Robert professeur agreacutegeacute Beacuteziers)mdash 1 post-doc (R Nheili ATER agrave 50)mdash 3 doctorants (C Chohra H de Lassus Saint-Geniegraves K Porada)

1 httpwebdaliuniv-perpfr

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Aucune arriveacutee de nouveau chercheur permanent Un deacutepart de MCF HDR et 15 doctorant en2015 Accueil drsquoun ATER par an Sur la peacuteriode concerneacutee les deux premiegraveres soutenances drsquoHDRde membres recruteacutes comme MCF dans lrsquoeacutequipe ont eu lieu (2014 2016) La bonne freacutequence desoutenance des doctorats et de leur dureacutee de preacuteparation ont eacuteteacute maintenues 5 thegraveses soutenues dansla peacuteriode et preacutepareacutees en 394 mois en moyenne Mentionnons deux thegraveses arrecircteacutees en 2016 lrsquoun surabandon du doctorant lrsquoautre sur deacutecision de lrsquoeacutecole doctorale apregraves avis du comiteacute de suivi de thegravese

La direction drsquoeacutequipe a eacuteteacute renouveleacutee en 2015 suite au deacutepart (inattendu) du preacuteceacutedent responsable(M Martel)

3 Organisation et vie de lrsquoeacutequipe

DALI a maintenu son positionnement scientifique resserreacute autour de la performance et de la preacuteci-sion des calculs tout en satisfaisant les besoins drsquoenseignement drsquoune petite universiteacute pluridisciplinaireDALI a inciteacute au dynamisme scientifique des membres de lrsquoeacutequipe et en particulier chacun drsquoentre eux aco-encadreacute au moins une thegravese dans la peacuteriode La vie scientifique profite de lrsquouniteacute de lieu de nouveauxlocaux depuis 2013 drsquoun seacuteminaire et de reacuteunions drsquoeacutequipe reacuteguliers Sur la peacuteriode ces activiteacutes onteacuteteacute renforceacutees par la mise en place de laquo journeacutees scientifiques hors labo raquo ougrave la totaliteacute des membresont eacutechangeacute autour de leurs travaux ainsi que par lrsquointervention reacuteguliegravere des doctorants en seacuteminaireCe dernier eacutevolue vers des interventions par visio-confeacuterence pour compenser le coucirct eacuteleveacute des deacutepla-cements vers Perpignan Lrsquointeacutegration au LIRMM constitue depuis 2011 une ouverture inteacuteressante travaux communs de lrsquoANR PAVOIS et du projet europeacuteen Mont-Blanc2 implication dans la vie dela plateforme HPCLR participation agrave la mise en place reacutegionale de lrsquoISN etc

4 Activiteacutes scientifiques

Lrsquouniteacute theacutematique des travaux de recherche pour ameacuteliorer la qualiteacute numeacuterique et la performancedes calculs est une des forces de lrsquoeacutequipe DALI

Lrsquoameacutelioration de la performance des calculs est eacutetroitement lieacutee aux ameacuteliorations apporteacutees auxmicro-architectures Celle-ci est reacutealiseacutee suivant plusieurs directions par eacutelargissement des chemins(micro-architecture vectorielle) multiplication des cœurs (paralleacutelisme de tacircches) ou encore augmen-tation du paralleacutelisme drsquoinstructions (ILP) La qualiteacute numeacuterique des applications de calcul scientifiqueou la validation du fonctionnement drsquoapplications embarqueacutees critiques deacutependent crucialement de lamaicirctrise des effets de la preacutecision finie des calculs mdash et de lrsquoarithmeacutetique flottante en particulier Ilsrsquoagit alors de controcircler et valider les calculs (algorithmes codes) mais aussi drsquoameacuteliorer et optimiserla preacutecision des calculs et des reacutesultats

Les travaux deacuteveloppeacutes sur la peacuteriode 2013-2016 sont organiseacutes autour de 4 actions de recherche

Action 1 Analyse du potentiel de paralleacutelisme et ameacutelioration des performances

Action 2 Meilleure exploitation des nouvelles architectures multicœurs

Action 3 Implantation sucircre et efficace de protocoles cryptographiques

Action 4 Algorithmes et outils pour une meilleure qualiteacute numeacuterique des calculs

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

41 Action 1 autour du logiciel PerPI

Notre approche de la performance des calculs srsquoappuie sur le paralleacutelisme drsquoinstructions (ILP) Lelogiciel PerPI (Performance et Paralleacutelisme drsquoInstructions) mesure le potentiel drsquoILP Les instructionsindeacutependantes sont consideacutereacutees comme paralleacutelisables quel que soit leur eacuteloignement mutuel [1] Onpeut ainsi exhiber tout le paralleacutelisme disponible ougrave qursquoil se situe dans le flot drsquoexeacutecution PerPInous permet de comprendre ougrave sont les freins au paralleacutelisme mdash ils viennent plus de lrsquoarchitectureque de lrsquoalgorithme ou du programme mdash et deacuteceler quantiteacute de sources de paralleacutelisme notammentdans les fonctions une fois enleveacutee la seacuterialisation par la pile et dans les boucles une fois transformeacuteesen fonctions reacutecursives On peut aussi quantifier lrsquoaugmentation de lrsquoILP par diverses transformationsde programmes et en deacuteduire une nouvelle forme de programmation plus propice agrave la paralleacutelisationmateacuterielle

Le calcul HPC srsquoappuie sur des bibliothegraveques matheacutematiques qui doivent ecirctre preacutecises et perfor-mantes Au niveau de lrsquoalgorithmique pour lrsquoarithmeacutetique agrave virgule flottante et en liaison avec lrsquoaction4 nous avons introduit des algorithmes compenseacutes qui produisent des reacutesultats arbitrairement preacute-cis et valideacutes qui beacuteneacuteficient de vitesse drsquoexeacutecution supeacuterieure aux solutions existantes Nous avonseacutetudieacute et expliqueacute cette efficaciteacute PerPI permet de caracteacuteriser le potentiel de performance des algo-rithmes numeacuteriques et ce de maniegravere reproductible contrairement aux approches classiques fondeacuteessur le deacutecompte des opeacuterations ou des cycles machines

42 Action 2 architectures multicœurs

Lrsquoarriveacutee des architectures agrave plusieurs dizaines ou millier de cœurs avec les GPU les uniteacutes multi- etmany-coeurs a reacutevolutionneacute le monde du HPC Srsquoil est deacutesormais possible drsquoeffectuer plus de calcul etplus vite de nouvelles contraintes apparaissent aux niveaux mateacuteriel et logiciel pour offrir des garantiessur les reacutesultats produits Ces contraintes sont de nature architecturale ou logicielle

Parmi les contraintes architecturales nous avons poursuivi nos travaux lieacutes agrave lrsquoeacutetude du compor-tement des GPU Premiegraverement nous avons constateacute que les GPU eacutetaient aussi sensibles que lesautres architectures aux vieillissements des circuits mais qursquoils preacutesentaient certaines singulariteacutes lieacuteesagrave leur structuration interne du calcul En exploitant ces singulariteacutes nous avons proposeacute des solutionspermettant de fiabiliser les calculs sur des architectures many-coeurs ayant des uniteacutes deacutefectueuses[ART5] Deuxiegravemement nous avons initieacute un travail sur lrsquoutiliteacute drsquointeacutegrer des opeacuterateurs speacutecialiseacutesparameacutetrables Cette deacutemarche est justifieacutee au niveau industriel par exemple par le rachat drsquoAltera parIntel

Concernant les contraintes logicielles la reacutecente multiplication des uniteacutes de calcul flottantes aconduit de nombreux deacuteveloppeur agrave utiliser des algorithmes parallegraveles pouvant geacuteneacuterer des problegravemesnumeacuteriques Nous avons par exemple analyseacute comment ces nouveaux algorithmes se comportent drsquounpoint de vue numeacuterique sur des applications concregravetes comme le parcours de graphe dans le cas dessmartgrids (thegravese de M Marin 2014) Ces nouvelles architectures eacutetant plus contraintes par le deacutebitmeacutemoire que par la capaciteacute de calcul il est deacutesormais inteacuteressant du point de vue du coucirct de consideacutererlrsquoutilisation drsquoarithmeacutetiques dites non-conventionnelles Sur cet exercice nous avons donc proposeacute unebibliothegraveque drsquoarithmeacutetique floue pour GPU afin de geacuterer les incertitudes de deuxiegraveme ordre [CACT29ART3] Dans ce cadre nous avons aussi proposeacute des solutions au problegraveme de la non-reproductibiliteacutenumeacuterique des reacutesultats lieacutes agrave la non-associativiteacute des opeacuterations flottantes qui seront plus largement

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

preacutesenteacutees avec lrsquoaction 4

43 Action 3 protocoles cryptographiques

Les protocoles cryptographiques les plus populaires sont RSA et les diffeacuterents protocoles baseacutessur les courbes elliptiques (ECC) Ces derniers ont gagneacute en attractiviteacute ducirc agrave leurs tailles de clefsreacuteduites et leurs nouvelles fonctionnaliteacutes provenant des couplages Notre recherche consiste agrave proposerde nouvelles approches pour lrsquoimplantation sucircre et efficace de protocoles cryptographiques RSA etECC

Lrsquoopeacuteration centrale des protocoles cryptographiques consiste en une seacutequence de multiplicationset drsquoadditions dans un corps ou un anneau finis Pour ameacuteliorer lrsquoefficaciteacute de ces protocoles cryp-tographiques nous avons proposeacute des ameacuteliorations des algorithmes pour la multiplications dans lescorps binaires [ART12 ART9 ART14 ART13] Nous avons aussi ameacutelioreacute le calcul des opeacuterationscombineacutees AB AC et AB + CD en partageant certains calculs communs [CACT21 CACT38]

Durant la peacuteriode nous avons participeacute au projet ANR Pavois qui a financeacute la thegravese de J-M Robert(2012-2015) Lrsquoobjectif de ce projet eacutetait de proposer de nouvelles protections contre les attaques agrave ca-naux cacheacutes sur des implantations mateacuterielles drsquoECC Ces attaques exploitent des fuites drsquoinformationque lrsquoon peut extraire de la puissance consommeacutee du temps de calcul ou de lrsquoeacutemanation eacutelectromagneacute-tique Nous avons travailleacute sur des algorithmes drsquoexponentiation ou de multiplication scalaire reacuteguliers[ART7 ART1] pour assurer une protection contre des attaques Simple Power Analysis Nous avonsaussi travailleacute sur la randomisation des opeacuterations modulaires dans le systegraveme de repreacutesentation RNS[CACT20] et en repreacutesentation classique [CACT5] Ces randomisations perturbent les calculs ce quipermet de mieux masquer les opeacuterations effectueacutees dans les mesures physiques

44 Action 4 pour une meilleure qualiteacute numeacuterique des calculs

Lrsquoameacutelioration de la qualiteacute numeacuterique des calculs est eacutetudieacutee selon deux angles la synthegravese decode et la reproductibiliteacute numeacuterique La synthegravese de code est motiveacutee par la diversiteacute des architec-tures mateacuterielles actuelles de leurs uniteacutes de calculs et des arithmeacutetiques qursquoelles supportent Eacutetantdonneacute un problegraveme numeacuterique (expression matheacutematique algorithme code numeacuterique preacute-existant)nous souhaitons produire une implantation qui soit agrave la fois rapide suffisamment preacutecise et certifieacuteePar ailleurs lrsquoutilisation massive du calcul parallegravele (HPC) pour simuler numeacuteriquement des problegravemescomplexes a reacutecemment fait eacutemerger des cas de non-reproductibiliteacute numeacuterique de reacutesultats les exeacutecu-tions successives drsquoune simulation retournent des reacutesultats diffeacuterents bien que les entreacutees et les scheacutemasde reacutesolution soient inchangeacutes Nous proposons des solutions algorithmiques et logicielles qui reacutesolventce problegraveme

Sur la peacuteriode concerneacutee lrsquoactiviteacute de synthegravese de code srsquoest deacuteveloppeacutee autour de deux objectifsAu niveau des briques numeacuteriques eg fonctions eacuteleacutementaires ou petits blocs drsquoalgegravebre lineacuteaire nousavons eacutetendu le champ drsquoapplication de lrsquooutil CGPE Initialement destineacute agrave la synthegravese automatiquede codes rapides et certifieacutes pour lrsquoeacutevaluation polynomiale en virgule fixe lrsquooutil CGPE permet au-jourdrsquohui de produire des codes pour eacutevaluer drsquoautres problegravemes (eg sommation produit scalaire)utilisant au mieux les instructions de lrsquoarchitecture cible CGPE peut maintenant produire automati-quement des programmes virgule fixe rapides et certifieacutes pour traiter des blocs numeacuteriques de plushaut niveau comme la multiplication ou lrsquoinversion de matrices [CACT34 CACT25] Ces travaux ont

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

eacuteteacute reacutealiseacutes dans le projet ANR DEFIS (2011-2015 et la thegravese de A Najahi (2014Ils ont donneacute lieu audeacuteveloppement de lrsquooutil FPLA Pour la virgule flottante nos travaux ont concerneacute lrsquoameacutelioration dela preacutecision agrave lrsquoaide de transformations sans erreur La thegravese de L Theacutevenoux (2014) fournit une infra-structure logicielle qui reacutealise une synthegravese de codes avec compromis performance-preacutecision Lrsquoenjeu estde deacuteterminer quelles parties de code transformer sans trop impacter les performances de lrsquoapplicationPour la virgule flottante nous nous sommes eacutegalement inteacuteresseacutes agrave la geacuteneacuteration de codes pour lrsquoeacuteva-luation de fonctions eacuteleacutementaires (exponentielle logarithme [CACT7] trigonomeacutetriques ) et plusparticuliegraverement agrave la prise en compte des contraintes architecturales lors du processus de geacuteneacuterationPar exemple une maniegravere drsquoimplanter ces fonctions matheacutematiques est drsquoutiliser une meacutethode agrave basede tables qui stocke le reacutesultat approcheacute de ces fonctions pour un ensemble drsquoarguments bien choisisDans le cadre du projet ANR MetaLibm (2013-2017) et de la thegravese de H de Lassus Saint-Geniegraves nousavons proposeacute une meacutethode qui permet de tabuler des valeurs exactes et ainsi reacuteduire la taille destables et acceacuteleacuterer le processus drsquoeacutevaluation [CACT19 CACT16]

La non-reproductibiliteacute numeacuterique du calcul parallegravele remet en question la fiabiliteacute et le degreacute deconfiance des simulations numeacuteriques de nombreux domaines drsquoapplication industrielle (chimie eacutenergeacute-tique ) ou de recherche (eacutetudes du climat du systegraveme solaire ) Le deacutebugage le test la validationou la certification par des autoriteacutes de controcircle imposent de corriger ce comportement essentiellementcauseacute par le non-deacuteterminisme des exeacutecutions parallegraveles (ordonnancement et reacuteductions dynamiques)la non-associativiteacute de lrsquoaddition de lrsquoarithmeacutetique flottante et la deacutependance entre la propagation deserreurs drsquoarrondis geacuteneacutereacutees et lrsquoordre des seacutequences de calcul [ART10] Nous appliquons le principedrsquoune augmentation cibleacutee de la preacutecision des calculs qui soit suffisante agrave la reproductibiliteacute numeacuteriquedans deux contextes diffeacuterents

Une premiegravere eacutetape est de pouvoir disposer de BLAS parallegraveles efficaces et numeacuteriquement re-productibles ces derniegraveres eacutetant les briques de base optimiseacutees de lrsquoalgegravebre lineacuteaire numeacuterique Deuxdirections ont eacuteteacute suivies Nous participons au deacuteveloppement de la bibliothegraveque exBLAS [ART6] quicible plus particuliegraverement les architectures massivement parallegraveles (GPU acceacuteleacuterateurs) Par ailleursdes BLAS de niveaux 1 et 2 preacutecises reproductibles et performantes baseacutees sur des algorithmes reacutecentsde sommation correctement arrondie sont aussi proposeacutees dans la bibliothegraveque RARE-BLAS (thegravese deC Chohra) [CACT8 CACT2 CACT3]

A large eacutechelle ensuite des techniques de compensation ont permis de retrouver la reproductibi-liteacute numeacuterique des simulations par eacuteleacutements finis du code drsquohydrodynamique industrielle open sourceTelemac-Mascaret (thegravese de R Nheili 2016) [CACT15 CACT18 CACT4]

5 Faits marquants

51 Prix et distinctions

mdash Best Paper Session pour lrsquoarticle Power Flow analysis under uncertainty using Symmetric FuzzyArithmetic agrave la confeacuterence IEEE PES-GM 2014

mdash Best Paper Award for GPU applications pour lrsquoarticle FuzzyGPU a fuzzy arithmetic libraryfor GPU agrave la confeacuterence PDP 2014

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 2: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Aucune arriveacutee de nouveau chercheur permanent Un deacutepart de MCF HDR et 15 doctorant en2015 Accueil drsquoun ATER par an Sur la peacuteriode concerneacutee les deux premiegraveres soutenances drsquoHDRde membres recruteacutes comme MCF dans lrsquoeacutequipe ont eu lieu (2014 2016) La bonne freacutequence desoutenance des doctorats et de leur dureacutee de preacuteparation ont eacuteteacute maintenues 5 thegraveses soutenues dansla peacuteriode et preacutepareacutees en 394 mois en moyenne Mentionnons deux thegraveses arrecircteacutees en 2016 lrsquoun surabandon du doctorant lrsquoautre sur deacutecision de lrsquoeacutecole doctorale apregraves avis du comiteacute de suivi de thegravese

La direction drsquoeacutequipe a eacuteteacute renouveleacutee en 2015 suite au deacutepart (inattendu) du preacuteceacutedent responsable(M Martel)

3 Organisation et vie de lrsquoeacutequipe

DALI a maintenu son positionnement scientifique resserreacute autour de la performance et de la preacuteci-sion des calculs tout en satisfaisant les besoins drsquoenseignement drsquoune petite universiteacute pluridisciplinaireDALI a inciteacute au dynamisme scientifique des membres de lrsquoeacutequipe et en particulier chacun drsquoentre eux aco-encadreacute au moins une thegravese dans la peacuteriode La vie scientifique profite de lrsquouniteacute de lieu de nouveauxlocaux depuis 2013 drsquoun seacuteminaire et de reacuteunions drsquoeacutequipe reacuteguliers Sur la peacuteriode ces activiteacutes onteacuteteacute renforceacutees par la mise en place de laquo journeacutees scientifiques hors labo raquo ougrave la totaliteacute des membresont eacutechangeacute autour de leurs travaux ainsi que par lrsquointervention reacuteguliegravere des doctorants en seacuteminaireCe dernier eacutevolue vers des interventions par visio-confeacuterence pour compenser le coucirct eacuteleveacute des deacutepla-cements vers Perpignan Lrsquointeacutegration au LIRMM constitue depuis 2011 une ouverture inteacuteressante travaux communs de lrsquoANR PAVOIS et du projet europeacuteen Mont-Blanc2 implication dans la vie dela plateforme HPCLR participation agrave la mise en place reacutegionale de lrsquoISN etc

4 Activiteacutes scientifiques

Lrsquouniteacute theacutematique des travaux de recherche pour ameacuteliorer la qualiteacute numeacuterique et la performancedes calculs est une des forces de lrsquoeacutequipe DALI

Lrsquoameacutelioration de la performance des calculs est eacutetroitement lieacutee aux ameacuteliorations apporteacutees auxmicro-architectures Celle-ci est reacutealiseacutee suivant plusieurs directions par eacutelargissement des chemins(micro-architecture vectorielle) multiplication des cœurs (paralleacutelisme de tacircches) ou encore augmen-tation du paralleacutelisme drsquoinstructions (ILP) La qualiteacute numeacuterique des applications de calcul scientifiqueou la validation du fonctionnement drsquoapplications embarqueacutees critiques deacutependent crucialement de lamaicirctrise des effets de la preacutecision finie des calculs mdash et de lrsquoarithmeacutetique flottante en particulier Ilsrsquoagit alors de controcircler et valider les calculs (algorithmes codes) mais aussi drsquoameacuteliorer et optimiserla preacutecision des calculs et des reacutesultats

Les travaux deacuteveloppeacutes sur la peacuteriode 2013-2016 sont organiseacutes autour de 4 actions de recherche

Action 1 Analyse du potentiel de paralleacutelisme et ameacutelioration des performances

Action 2 Meilleure exploitation des nouvelles architectures multicœurs

Action 3 Implantation sucircre et efficace de protocoles cryptographiques

Action 4 Algorithmes et outils pour une meilleure qualiteacute numeacuterique des calculs

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

41 Action 1 autour du logiciel PerPI

Notre approche de la performance des calculs srsquoappuie sur le paralleacutelisme drsquoinstructions (ILP) Lelogiciel PerPI (Performance et Paralleacutelisme drsquoInstructions) mesure le potentiel drsquoILP Les instructionsindeacutependantes sont consideacutereacutees comme paralleacutelisables quel que soit leur eacuteloignement mutuel [1] Onpeut ainsi exhiber tout le paralleacutelisme disponible ougrave qursquoil se situe dans le flot drsquoexeacutecution PerPInous permet de comprendre ougrave sont les freins au paralleacutelisme mdash ils viennent plus de lrsquoarchitectureque de lrsquoalgorithme ou du programme mdash et deacuteceler quantiteacute de sources de paralleacutelisme notammentdans les fonctions une fois enleveacutee la seacuterialisation par la pile et dans les boucles une fois transformeacuteesen fonctions reacutecursives On peut aussi quantifier lrsquoaugmentation de lrsquoILP par diverses transformationsde programmes et en deacuteduire une nouvelle forme de programmation plus propice agrave la paralleacutelisationmateacuterielle

Le calcul HPC srsquoappuie sur des bibliothegraveques matheacutematiques qui doivent ecirctre preacutecises et perfor-mantes Au niveau de lrsquoalgorithmique pour lrsquoarithmeacutetique agrave virgule flottante et en liaison avec lrsquoaction4 nous avons introduit des algorithmes compenseacutes qui produisent des reacutesultats arbitrairement preacute-cis et valideacutes qui beacuteneacuteficient de vitesse drsquoexeacutecution supeacuterieure aux solutions existantes Nous avonseacutetudieacute et expliqueacute cette efficaciteacute PerPI permet de caracteacuteriser le potentiel de performance des algo-rithmes numeacuteriques et ce de maniegravere reproductible contrairement aux approches classiques fondeacuteessur le deacutecompte des opeacuterations ou des cycles machines

42 Action 2 architectures multicœurs

Lrsquoarriveacutee des architectures agrave plusieurs dizaines ou millier de cœurs avec les GPU les uniteacutes multi- etmany-coeurs a reacutevolutionneacute le monde du HPC Srsquoil est deacutesormais possible drsquoeffectuer plus de calcul etplus vite de nouvelles contraintes apparaissent aux niveaux mateacuteriel et logiciel pour offrir des garantiessur les reacutesultats produits Ces contraintes sont de nature architecturale ou logicielle

Parmi les contraintes architecturales nous avons poursuivi nos travaux lieacutes agrave lrsquoeacutetude du compor-tement des GPU Premiegraverement nous avons constateacute que les GPU eacutetaient aussi sensibles que lesautres architectures aux vieillissements des circuits mais qursquoils preacutesentaient certaines singulariteacutes lieacuteesagrave leur structuration interne du calcul En exploitant ces singulariteacutes nous avons proposeacute des solutionspermettant de fiabiliser les calculs sur des architectures many-coeurs ayant des uniteacutes deacutefectueuses[ART5] Deuxiegravemement nous avons initieacute un travail sur lrsquoutiliteacute drsquointeacutegrer des opeacuterateurs speacutecialiseacutesparameacutetrables Cette deacutemarche est justifieacutee au niveau industriel par exemple par le rachat drsquoAltera parIntel

Concernant les contraintes logicielles la reacutecente multiplication des uniteacutes de calcul flottantes aconduit de nombreux deacuteveloppeur agrave utiliser des algorithmes parallegraveles pouvant geacuteneacuterer des problegravemesnumeacuteriques Nous avons par exemple analyseacute comment ces nouveaux algorithmes se comportent drsquounpoint de vue numeacuterique sur des applications concregravetes comme le parcours de graphe dans le cas dessmartgrids (thegravese de M Marin 2014) Ces nouvelles architectures eacutetant plus contraintes par le deacutebitmeacutemoire que par la capaciteacute de calcul il est deacutesormais inteacuteressant du point de vue du coucirct de consideacutererlrsquoutilisation drsquoarithmeacutetiques dites non-conventionnelles Sur cet exercice nous avons donc proposeacute unebibliothegraveque drsquoarithmeacutetique floue pour GPU afin de geacuterer les incertitudes de deuxiegraveme ordre [CACT29ART3] Dans ce cadre nous avons aussi proposeacute des solutions au problegraveme de la non-reproductibiliteacutenumeacuterique des reacutesultats lieacutes agrave la non-associativiteacute des opeacuterations flottantes qui seront plus largement

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

preacutesenteacutees avec lrsquoaction 4

43 Action 3 protocoles cryptographiques

Les protocoles cryptographiques les plus populaires sont RSA et les diffeacuterents protocoles baseacutessur les courbes elliptiques (ECC) Ces derniers ont gagneacute en attractiviteacute ducirc agrave leurs tailles de clefsreacuteduites et leurs nouvelles fonctionnaliteacutes provenant des couplages Notre recherche consiste agrave proposerde nouvelles approches pour lrsquoimplantation sucircre et efficace de protocoles cryptographiques RSA etECC

Lrsquoopeacuteration centrale des protocoles cryptographiques consiste en une seacutequence de multiplicationset drsquoadditions dans un corps ou un anneau finis Pour ameacuteliorer lrsquoefficaciteacute de ces protocoles cryp-tographiques nous avons proposeacute des ameacuteliorations des algorithmes pour la multiplications dans lescorps binaires [ART12 ART9 ART14 ART13] Nous avons aussi ameacutelioreacute le calcul des opeacuterationscombineacutees AB AC et AB + CD en partageant certains calculs communs [CACT21 CACT38]

Durant la peacuteriode nous avons participeacute au projet ANR Pavois qui a financeacute la thegravese de J-M Robert(2012-2015) Lrsquoobjectif de ce projet eacutetait de proposer de nouvelles protections contre les attaques agrave ca-naux cacheacutes sur des implantations mateacuterielles drsquoECC Ces attaques exploitent des fuites drsquoinformationque lrsquoon peut extraire de la puissance consommeacutee du temps de calcul ou de lrsquoeacutemanation eacutelectromagneacute-tique Nous avons travailleacute sur des algorithmes drsquoexponentiation ou de multiplication scalaire reacuteguliers[ART7 ART1] pour assurer une protection contre des attaques Simple Power Analysis Nous avonsaussi travailleacute sur la randomisation des opeacuterations modulaires dans le systegraveme de repreacutesentation RNS[CACT20] et en repreacutesentation classique [CACT5] Ces randomisations perturbent les calculs ce quipermet de mieux masquer les opeacuterations effectueacutees dans les mesures physiques

44 Action 4 pour une meilleure qualiteacute numeacuterique des calculs

Lrsquoameacutelioration de la qualiteacute numeacuterique des calculs est eacutetudieacutee selon deux angles la synthegravese decode et la reproductibiliteacute numeacuterique La synthegravese de code est motiveacutee par la diversiteacute des architec-tures mateacuterielles actuelles de leurs uniteacutes de calculs et des arithmeacutetiques qursquoelles supportent Eacutetantdonneacute un problegraveme numeacuterique (expression matheacutematique algorithme code numeacuterique preacute-existant)nous souhaitons produire une implantation qui soit agrave la fois rapide suffisamment preacutecise et certifieacuteePar ailleurs lrsquoutilisation massive du calcul parallegravele (HPC) pour simuler numeacuteriquement des problegravemescomplexes a reacutecemment fait eacutemerger des cas de non-reproductibiliteacute numeacuterique de reacutesultats les exeacutecu-tions successives drsquoune simulation retournent des reacutesultats diffeacuterents bien que les entreacutees et les scheacutemasde reacutesolution soient inchangeacutes Nous proposons des solutions algorithmiques et logicielles qui reacutesolventce problegraveme

Sur la peacuteriode concerneacutee lrsquoactiviteacute de synthegravese de code srsquoest deacuteveloppeacutee autour de deux objectifsAu niveau des briques numeacuteriques eg fonctions eacuteleacutementaires ou petits blocs drsquoalgegravebre lineacuteaire nousavons eacutetendu le champ drsquoapplication de lrsquooutil CGPE Initialement destineacute agrave la synthegravese automatiquede codes rapides et certifieacutes pour lrsquoeacutevaluation polynomiale en virgule fixe lrsquooutil CGPE permet au-jourdrsquohui de produire des codes pour eacutevaluer drsquoautres problegravemes (eg sommation produit scalaire)utilisant au mieux les instructions de lrsquoarchitecture cible CGPE peut maintenant produire automati-quement des programmes virgule fixe rapides et certifieacutes pour traiter des blocs numeacuteriques de plushaut niveau comme la multiplication ou lrsquoinversion de matrices [CACT34 CACT25] Ces travaux ont

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

eacuteteacute reacutealiseacutes dans le projet ANR DEFIS (2011-2015 et la thegravese de A Najahi (2014Ils ont donneacute lieu audeacuteveloppement de lrsquooutil FPLA Pour la virgule flottante nos travaux ont concerneacute lrsquoameacutelioration dela preacutecision agrave lrsquoaide de transformations sans erreur La thegravese de L Theacutevenoux (2014) fournit une infra-structure logicielle qui reacutealise une synthegravese de codes avec compromis performance-preacutecision Lrsquoenjeu estde deacuteterminer quelles parties de code transformer sans trop impacter les performances de lrsquoapplicationPour la virgule flottante nous nous sommes eacutegalement inteacuteresseacutes agrave la geacuteneacuteration de codes pour lrsquoeacuteva-luation de fonctions eacuteleacutementaires (exponentielle logarithme [CACT7] trigonomeacutetriques ) et plusparticuliegraverement agrave la prise en compte des contraintes architecturales lors du processus de geacuteneacuterationPar exemple une maniegravere drsquoimplanter ces fonctions matheacutematiques est drsquoutiliser une meacutethode agrave basede tables qui stocke le reacutesultat approcheacute de ces fonctions pour un ensemble drsquoarguments bien choisisDans le cadre du projet ANR MetaLibm (2013-2017) et de la thegravese de H de Lassus Saint-Geniegraves nousavons proposeacute une meacutethode qui permet de tabuler des valeurs exactes et ainsi reacuteduire la taille destables et acceacuteleacuterer le processus drsquoeacutevaluation [CACT19 CACT16]

La non-reproductibiliteacute numeacuterique du calcul parallegravele remet en question la fiabiliteacute et le degreacute deconfiance des simulations numeacuteriques de nombreux domaines drsquoapplication industrielle (chimie eacutenergeacute-tique ) ou de recherche (eacutetudes du climat du systegraveme solaire ) Le deacutebugage le test la validationou la certification par des autoriteacutes de controcircle imposent de corriger ce comportement essentiellementcauseacute par le non-deacuteterminisme des exeacutecutions parallegraveles (ordonnancement et reacuteductions dynamiques)la non-associativiteacute de lrsquoaddition de lrsquoarithmeacutetique flottante et la deacutependance entre la propagation deserreurs drsquoarrondis geacuteneacutereacutees et lrsquoordre des seacutequences de calcul [ART10] Nous appliquons le principedrsquoune augmentation cibleacutee de la preacutecision des calculs qui soit suffisante agrave la reproductibiliteacute numeacuteriquedans deux contextes diffeacuterents

Une premiegravere eacutetape est de pouvoir disposer de BLAS parallegraveles efficaces et numeacuteriquement re-productibles ces derniegraveres eacutetant les briques de base optimiseacutees de lrsquoalgegravebre lineacuteaire numeacuterique Deuxdirections ont eacuteteacute suivies Nous participons au deacuteveloppement de la bibliothegraveque exBLAS [ART6] quicible plus particuliegraverement les architectures massivement parallegraveles (GPU acceacuteleacuterateurs) Par ailleursdes BLAS de niveaux 1 et 2 preacutecises reproductibles et performantes baseacutees sur des algorithmes reacutecentsde sommation correctement arrondie sont aussi proposeacutees dans la bibliothegraveque RARE-BLAS (thegravese deC Chohra) [CACT8 CACT2 CACT3]

A large eacutechelle ensuite des techniques de compensation ont permis de retrouver la reproductibi-liteacute numeacuterique des simulations par eacuteleacutements finis du code drsquohydrodynamique industrielle open sourceTelemac-Mascaret (thegravese de R Nheili 2016) [CACT15 CACT18 CACT4]

5 Faits marquants

51 Prix et distinctions

mdash Best Paper Session pour lrsquoarticle Power Flow analysis under uncertainty using Symmetric FuzzyArithmetic agrave la confeacuterence IEEE PES-GM 2014

mdash Best Paper Award for GPU applications pour lrsquoarticle FuzzyGPU a fuzzy arithmetic libraryfor GPU agrave la confeacuterence PDP 2014

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 3: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

41 Action 1 autour du logiciel PerPI

Notre approche de la performance des calculs srsquoappuie sur le paralleacutelisme drsquoinstructions (ILP) Lelogiciel PerPI (Performance et Paralleacutelisme drsquoInstructions) mesure le potentiel drsquoILP Les instructionsindeacutependantes sont consideacutereacutees comme paralleacutelisables quel que soit leur eacuteloignement mutuel [1] Onpeut ainsi exhiber tout le paralleacutelisme disponible ougrave qursquoil se situe dans le flot drsquoexeacutecution PerPInous permet de comprendre ougrave sont les freins au paralleacutelisme mdash ils viennent plus de lrsquoarchitectureque de lrsquoalgorithme ou du programme mdash et deacuteceler quantiteacute de sources de paralleacutelisme notammentdans les fonctions une fois enleveacutee la seacuterialisation par la pile et dans les boucles une fois transformeacuteesen fonctions reacutecursives On peut aussi quantifier lrsquoaugmentation de lrsquoILP par diverses transformationsde programmes et en deacuteduire une nouvelle forme de programmation plus propice agrave la paralleacutelisationmateacuterielle

Le calcul HPC srsquoappuie sur des bibliothegraveques matheacutematiques qui doivent ecirctre preacutecises et perfor-mantes Au niveau de lrsquoalgorithmique pour lrsquoarithmeacutetique agrave virgule flottante et en liaison avec lrsquoaction4 nous avons introduit des algorithmes compenseacutes qui produisent des reacutesultats arbitrairement preacute-cis et valideacutes qui beacuteneacuteficient de vitesse drsquoexeacutecution supeacuterieure aux solutions existantes Nous avonseacutetudieacute et expliqueacute cette efficaciteacute PerPI permet de caracteacuteriser le potentiel de performance des algo-rithmes numeacuteriques et ce de maniegravere reproductible contrairement aux approches classiques fondeacuteessur le deacutecompte des opeacuterations ou des cycles machines

42 Action 2 architectures multicœurs

Lrsquoarriveacutee des architectures agrave plusieurs dizaines ou millier de cœurs avec les GPU les uniteacutes multi- etmany-coeurs a reacutevolutionneacute le monde du HPC Srsquoil est deacutesormais possible drsquoeffectuer plus de calcul etplus vite de nouvelles contraintes apparaissent aux niveaux mateacuteriel et logiciel pour offrir des garantiessur les reacutesultats produits Ces contraintes sont de nature architecturale ou logicielle

Parmi les contraintes architecturales nous avons poursuivi nos travaux lieacutes agrave lrsquoeacutetude du compor-tement des GPU Premiegraverement nous avons constateacute que les GPU eacutetaient aussi sensibles que lesautres architectures aux vieillissements des circuits mais qursquoils preacutesentaient certaines singulariteacutes lieacuteesagrave leur structuration interne du calcul En exploitant ces singulariteacutes nous avons proposeacute des solutionspermettant de fiabiliser les calculs sur des architectures many-coeurs ayant des uniteacutes deacutefectueuses[ART5] Deuxiegravemement nous avons initieacute un travail sur lrsquoutiliteacute drsquointeacutegrer des opeacuterateurs speacutecialiseacutesparameacutetrables Cette deacutemarche est justifieacutee au niveau industriel par exemple par le rachat drsquoAltera parIntel

Concernant les contraintes logicielles la reacutecente multiplication des uniteacutes de calcul flottantes aconduit de nombreux deacuteveloppeur agrave utiliser des algorithmes parallegraveles pouvant geacuteneacuterer des problegravemesnumeacuteriques Nous avons par exemple analyseacute comment ces nouveaux algorithmes se comportent drsquounpoint de vue numeacuterique sur des applications concregravetes comme le parcours de graphe dans le cas dessmartgrids (thegravese de M Marin 2014) Ces nouvelles architectures eacutetant plus contraintes par le deacutebitmeacutemoire que par la capaciteacute de calcul il est deacutesormais inteacuteressant du point de vue du coucirct de consideacutererlrsquoutilisation drsquoarithmeacutetiques dites non-conventionnelles Sur cet exercice nous avons donc proposeacute unebibliothegraveque drsquoarithmeacutetique floue pour GPU afin de geacuterer les incertitudes de deuxiegraveme ordre [CACT29ART3] Dans ce cadre nous avons aussi proposeacute des solutions au problegraveme de la non-reproductibiliteacutenumeacuterique des reacutesultats lieacutes agrave la non-associativiteacute des opeacuterations flottantes qui seront plus largement

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

preacutesenteacutees avec lrsquoaction 4

43 Action 3 protocoles cryptographiques

Les protocoles cryptographiques les plus populaires sont RSA et les diffeacuterents protocoles baseacutessur les courbes elliptiques (ECC) Ces derniers ont gagneacute en attractiviteacute ducirc agrave leurs tailles de clefsreacuteduites et leurs nouvelles fonctionnaliteacutes provenant des couplages Notre recherche consiste agrave proposerde nouvelles approches pour lrsquoimplantation sucircre et efficace de protocoles cryptographiques RSA etECC

Lrsquoopeacuteration centrale des protocoles cryptographiques consiste en une seacutequence de multiplicationset drsquoadditions dans un corps ou un anneau finis Pour ameacuteliorer lrsquoefficaciteacute de ces protocoles cryp-tographiques nous avons proposeacute des ameacuteliorations des algorithmes pour la multiplications dans lescorps binaires [ART12 ART9 ART14 ART13] Nous avons aussi ameacutelioreacute le calcul des opeacuterationscombineacutees AB AC et AB + CD en partageant certains calculs communs [CACT21 CACT38]

Durant la peacuteriode nous avons participeacute au projet ANR Pavois qui a financeacute la thegravese de J-M Robert(2012-2015) Lrsquoobjectif de ce projet eacutetait de proposer de nouvelles protections contre les attaques agrave ca-naux cacheacutes sur des implantations mateacuterielles drsquoECC Ces attaques exploitent des fuites drsquoinformationque lrsquoon peut extraire de la puissance consommeacutee du temps de calcul ou de lrsquoeacutemanation eacutelectromagneacute-tique Nous avons travailleacute sur des algorithmes drsquoexponentiation ou de multiplication scalaire reacuteguliers[ART7 ART1] pour assurer une protection contre des attaques Simple Power Analysis Nous avonsaussi travailleacute sur la randomisation des opeacuterations modulaires dans le systegraveme de repreacutesentation RNS[CACT20] et en repreacutesentation classique [CACT5] Ces randomisations perturbent les calculs ce quipermet de mieux masquer les opeacuterations effectueacutees dans les mesures physiques

44 Action 4 pour une meilleure qualiteacute numeacuterique des calculs

Lrsquoameacutelioration de la qualiteacute numeacuterique des calculs est eacutetudieacutee selon deux angles la synthegravese decode et la reproductibiliteacute numeacuterique La synthegravese de code est motiveacutee par la diversiteacute des architec-tures mateacuterielles actuelles de leurs uniteacutes de calculs et des arithmeacutetiques qursquoelles supportent Eacutetantdonneacute un problegraveme numeacuterique (expression matheacutematique algorithme code numeacuterique preacute-existant)nous souhaitons produire une implantation qui soit agrave la fois rapide suffisamment preacutecise et certifieacuteePar ailleurs lrsquoutilisation massive du calcul parallegravele (HPC) pour simuler numeacuteriquement des problegravemescomplexes a reacutecemment fait eacutemerger des cas de non-reproductibiliteacute numeacuterique de reacutesultats les exeacutecu-tions successives drsquoune simulation retournent des reacutesultats diffeacuterents bien que les entreacutees et les scheacutemasde reacutesolution soient inchangeacutes Nous proposons des solutions algorithmiques et logicielles qui reacutesolventce problegraveme

Sur la peacuteriode concerneacutee lrsquoactiviteacute de synthegravese de code srsquoest deacuteveloppeacutee autour de deux objectifsAu niveau des briques numeacuteriques eg fonctions eacuteleacutementaires ou petits blocs drsquoalgegravebre lineacuteaire nousavons eacutetendu le champ drsquoapplication de lrsquooutil CGPE Initialement destineacute agrave la synthegravese automatiquede codes rapides et certifieacutes pour lrsquoeacutevaluation polynomiale en virgule fixe lrsquooutil CGPE permet au-jourdrsquohui de produire des codes pour eacutevaluer drsquoautres problegravemes (eg sommation produit scalaire)utilisant au mieux les instructions de lrsquoarchitecture cible CGPE peut maintenant produire automati-quement des programmes virgule fixe rapides et certifieacutes pour traiter des blocs numeacuteriques de plushaut niveau comme la multiplication ou lrsquoinversion de matrices [CACT34 CACT25] Ces travaux ont

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

eacuteteacute reacutealiseacutes dans le projet ANR DEFIS (2011-2015 et la thegravese de A Najahi (2014Ils ont donneacute lieu audeacuteveloppement de lrsquooutil FPLA Pour la virgule flottante nos travaux ont concerneacute lrsquoameacutelioration dela preacutecision agrave lrsquoaide de transformations sans erreur La thegravese de L Theacutevenoux (2014) fournit une infra-structure logicielle qui reacutealise une synthegravese de codes avec compromis performance-preacutecision Lrsquoenjeu estde deacuteterminer quelles parties de code transformer sans trop impacter les performances de lrsquoapplicationPour la virgule flottante nous nous sommes eacutegalement inteacuteresseacutes agrave la geacuteneacuteration de codes pour lrsquoeacuteva-luation de fonctions eacuteleacutementaires (exponentielle logarithme [CACT7] trigonomeacutetriques ) et plusparticuliegraverement agrave la prise en compte des contraintes architecturales lors du processus de geacuteneacuterationPar exemple une maniegravere drsquoimplanter ces fonctions matheacutematiques est drsquoutiliser une meacutethode agrave basede tables qui stocke le reacutesultat approcheacute de ces fonctions pour un ensemble drsquoarguments bien choisisDans le cadre du projet ANR MetaLibm (2013-2017) et de la thegravese de H de Lassus Saint-Geniegraves nousavons proposeacute une meacutethode qui permet de tabuler des valeurs exactes et ainsi reacuteduire la taille destables et acceacuteleacuterer le processus drsquoeacutevaluation [CACT19 CACT16]

La non-reproductibiliteacute numeacuterique du calcul parallegravele remet en question la fiabiliteacute et le degreacute deconfiance des simulations numeacuteriques de nombreux domaines drsquoapplication industrielle (chimie eacutenergeacute-tique ) ou de recherche (eacutetudes du climat du systegraveme solaire ) Le deacutebugage le test la validationou la certification par des autoriteacutes de controcircle imposent de corriger ce comportement essentiellementcauseacute par le non-deacuteterminisme des exeacutecutions parallegraveles (ordonnancement et reacuteductions dynamiques)la non-associativiteacute de lrsquoaddition de lrsquoarithmeacutetique flottante et la deacutependance entre la propagation deserreurs drsquoarrondis geacuteneacutereacutees et lrsquoordre des seacutequences de calcul [ART10] Nous appliquons le principedrsquoune augmentation cibleacutee de la preacutecision des calculs qui soit suffisante agrave la reproductibiliteacute numeacuteriquedans deux contextes diffeacuterents

Une premiegravere eacutetape est de pouvoir disposer de BLAS parallegraveles efficaces et numeacuteriquement re-productibles ces derniegraveres eacutetant les briques de base optimiseacutees de lrsquoalgegravebre lineacuteaire numeacuterique Deuxdirections ont eacuteteacute suivies Nous participons au deacuteveloppement de la bibliothegraveque exBLAS [ART6] quicible plus particuliegraverement les architectures massivement parallegraveles (GPU acceacuteleacuterateurs) Par ailleursdes BLAS de niveaux 1 et 2 preacutecises reproductibles et performantes baseacutees sur des algorithmes reacutecentsde sommation correctement arrondie sont aussi proposeacutees dans la bibliothegraveque RARE-BLAS (thegravese deC Chohra) [CACT8 CACT2 CACT3]

A large eacutechelle ensuite des techniques de compensation ont permis de retrouver la reproductibi-liteacute numeacuterique des simulations par eacuteleacutements finis du code drsquohydrodynamique industrielle open sourceTelemac-Mascaret (thegravese de R Nheili 2016) [CACT15 CACT18 CACT4]

5 Faits marquants

51 Prix et distinctions

mdash Best Paper Session pour lrsquoarticle Power Flow analysis under uncertainty using Symmetric FuzzyArithmetic agrave la confeacuterence IEEE PES-GM 2014

mdash Best Paper Award for GPU applications pour lrsquoarticle FuzzyGPU a fuzzy arithmetic libraryfor GPU agrave la confeacuterence PDP 2014

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 4: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

preacutesenteacutees avec lrsquoaction 4

43 Action 3 protocoles cryptographiques

Les protocoles cryptographiques les plus populaires sont RSA et les diffeacuterents protocoles baseacutessur les courbes elliptiques (ECC) Ces derniers ont gagneacute en attractiviteacute ducirc agrave leurs tailles de clefsreacuteduites et leurs nouvelles fonctionnaliteacutes provenant des couplages Notre recherche consiste agrave proposerde nouvelles approches pour lrsquoimplantation sucircre et efficace de protocoles cryptographiques RSA etECC

Lrsquoopeacuteration centrale des protocoles cryptographiques consiste en une seacutequence de multiplicationset drsquoadditions dans un corps ou un anneau finis Pour ameacuteliorer lrsquoefficaciteacute de ces protocoles cryp-tographiques nous avons proposeacute des ameacuteliorations des algorithmes pour la multiplications dans lescorps binaires [ART12 ART9 ART14 ART13] Nous avons aussi ameacutelioreacute le calcul des opeacuterationscombineacutees AB AC et AB + CD en partageant certains calculs communs [CACT21 CACT38]

Durant la peacuteriode nous avons participeacute au projet ANR Pavois qui a financeacute la thegravese de J-M Robert(2012-2015) Lrsquoobjectif de ce projet eacutetait de proposer de nouvelles protections contre les attaques agrave ca-naux cacheacutes sur des implantations mateacuterielles drsquoECC Ces attaques exploitent des fuites drsquoinformationque lrsquoon peut extraire de la puissance consommeacutee du temps de calcul ou de lrsquoeacutemanation eacutelectromagneacute-tique Nous avons travailleacute sur des algorithmes drsquoexponentiation ou de multiplication scalaire reacuteguliers[ART7 ART1] pour assurer une protection contre des attaques Simple Power Analysis Nous avonsaussi travailleacute sur la randomisation des opeacuterations modulaires dans le systegraveme de repreacutesentation RNS[CACT20] et en repreacutesentation classique [CACT5] Ces randomisations perturbent les calculs ce quipermet de mieux masquer les opeacuterations effectueacutees dans les mesures physiques

44 Action 4 pour une meilleure qualiteacute numeacuterique des calculs

Lrsquoameacutelioration de la qualiteacute numeacuterique des calculs est eacutetudieacutee selon deux angles la synthegravese decode et la reproductibiliteacute numeacuterique La synthegravese de code est motiveacutee par la diversiteacute des architec-tures mateacuterielles actuelles de leurs uniteacutes de calculs et des arithmeacutetiques qursquoelles supportent Eacutetantdonneacute un problegraveme numeacuterique (expression matheacutematique algorithme code numeacuterique preacute-existant)nous souhaitons produire une implantation qui soit agrave la fois rapide suffisamment preacutecise et certifieacuteePar ailleurs lrsquoutilisation massive du calcul parallegravele (HPC) pour simuler numeacuteriquement des problegravemescomplexes a reacutecemment fait eacutemerger des cas de non-reproductibiliteacute numeacuterique de reacutesultats les exeacutecu-tions successives drsquoune simulation retournent des reacutesultats diffeacuterents bien que les entreacutees et les scheacutemasde reacutesolution soient inchangeacutes Nous proposons des solutions algorithmiques et logicielles qui reacutesolventce problegraveme

Sur la peacuteriode concerneacutee lrsquoactiviteacute de synthegravese de code srsquoest deacuteveloppeacutee autour de deux objectifsAu niveau des briques numeacuteriques eg fonctions eacuteleacutementaires ou petits blocs drsquoalgegravebre lineacuteaire nousavons eacutetendu le champ drsquoapplication de lrsquooutil CGPE Initialement destineacute agrave la synthegravese automatiquede codes rapides et certifieacutes pour lrsquoeacutevaluation polynomiale en virgule fixe lrsquooutil CGPE permet au-jourdrsquohui de produire des codes pour eacutevaluer drsquoautres problegravemes (eg sommation produit scalaire)utilisant au mieux les instructions de lrsquoarchitecture cible CGPE peut maintenant produire automati-quement des programmes virgule fixe rapides et certifieacutes pour traiter des blocs numeacuteriques de plushaut niveau comme la multiplication ou lrsquoinversion de matrices [CACT34 CACT25] Ces travaux ont

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

eacuteteacute reacutealiseacutes dans le projet ANR DEFIS (2011-2015 et la thegravese de A Najahi (2014Ils ont donneacute lieu audeacuteveloppement de lrsquooutil FPLA Pour la virgule flottante nos travaux ont concerneacute lrsquoameacutelioration dela preacutecision agrave lrsquoaide de transformations sans erreur La thegravese de L Theacutevenoux (2014) fournit une infra-structure logicielle qui reacutealise une synthegravese de codes avec compromis performance-preacutecision Lrsquoenjeu estde deacuteterminer quelles parties de code transformer sans trop impacter les performances de lrsquoapplicationPour la virgule flottante nous nous sommes eacutegalement inteacuteresseacutes agrave la geacuteneacuteration de codes pour lrsquoeacuteva-luation de fonctions eacuteleacutementaires (exponentielle logarithme [CACT7] trigonomeacutetriques ) et plusparticuliegraverement agrave la prise en compte des contraintes architecturales lors du processus de geacuteneacuterationPar exemple une maniegravere drsquoimplanter ces fonctions matheacutematiques est drsquoutiliser une meacutethode agrave basede tables qui stocke le reacutesultat approcheacute de ces fonctions pour un ensemble drsquoarguments bien choisisDans le cadre du projet ANR MetaLibm (2013-2017) et de la thegravese de H de Lassus Saint-Geniegraves nousavons proposeacute une meacutethode qui permet de tabuler des valeurs exactes et ainsi reacuteduire la taille destables et acceacuteleacuterer le processus drsquoeacutevaluation [CACT19 CACT16]

La non-reproductibiliteacute numeacuterique du calcul parallegravele remet en question la fiabiliteacute et le degreacute deconfiance des simulations numeacuteriques de nombreux domaines drsquoapplication industrielle (chimie eacutenergeacute-tique ) ou de recherche (eacutetudes du climat du systegraveme solaire ) Le deacutebugage le test la validationou la certification par des autoriteacutes de controcircle imposent de corriger ce comportement essentiellementcauseacute par le non-deacuteterminisme des exeacutecutions parallegraveles (ordonnancement et reacuteductions dynamiques)la non-associativiteacute de lrsquoaddition de lrsquoarithmeacutetique flottante et la deacutependance entre la propagation deserreurs drsquoarrondis geacuteneacutereacutees et lrsquoordre des seacutequences de calcul [ART10] Nous appliquons le principedrsquoune augmentation cibleacutee de la preacutecision des calculs qui soit suffisante agrave la reproductibiliteacute numeacuteriquedans deux contextes diffeacuterents

Une premiegravere eacutetape est de pouvoir disposer de BLAS parallegraveles efficaces et numeacuteriquement re-productibles ces derniegraveres eacutetant les briques de base optimiseacutees de lrsquoalgegravebre lineacuteaire numeacuterique Deuxdirections ont eacuteteacute suivies Nous participons au deacuteveloppement de la bibliothegraveque exBLAS [ART6] quicible plus particuliegraverement les architectures massivement parallegraveles (GPU acceacuteleacuterateurs) Par ailleursdes BLAS de niveaux 1 et 2 preacutecises reproductibles et performantes baseacutees sur des algorithmes reacutecentsde sommation correctement arrondie sont aussi proposeacutees dans la bibliothegraveque RARE-BLAS (thegravese deC Chohra) [CACT8 CACT2 CACT3]

A large eacutechelle ensuite des techniques de compensation ont permis de retrouver la reproductibi-liteacute numeacuterique des simulations par eacuteleacutements finis du code drsquohydrodynamique industrielle open sourceTelemac-Mascaret (thegravese de R Nheili 2016) [CACT15 CACT18 CACT4]

5 Faits marquants

51 Prix et distinctions

mdash Best Paper Session pour lrsquoarticle Power Flow analysis under uncertainty using Symmetric FuzzyArithmetic agrave la confeacuterence IEEE PES-GM 2014

mdash Best Paper Award for GPU applications pour lrsquoarticle FuzzyGPU a fuzzy arithmetic libraryfor GPU agrave la confeacuterence PDP 2014

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 5: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

eacuteteacute reacutealiseacutes dans le projet ANR DEFIS (2011-2015 et la thegravese de A Najahi (2014Ils ont donneacute lieu audeacuteveloppement de lrsquooutil FPLA Pour la virgule flottante nos travaux ont concerneacute lrsquoameacutelioration dela preacutecision agrave lrsquoaide de transformations sans erreur La thegravese de L Theacutevenoux (2014) fournit une infra-structure logicielle qui reacutealise une synthegravese de codes avec compromis performance-preacutecision Lrsquoenjeu estde deacuteterminer quelles parties de code transformer sans trop impacter les performances de lrsquoapplicationPour la virgule flottante nous nous sommes eacutegalement inteacuteresseacutes agrave la geacuteneacuteration de codes pour lrsquoeacuteva-luation de fonctions eacuteleacutementaires (exponentielle logarithme [CACT7] trigonomeacutetriques ) et plusparticuliegraverement agrave la prise en compte des contraintes architecturales lors du processus de geacuteneacuterationPar exemple une maniegravere drsquoimplanter ces fonctions matheacutematiques est drsquoutiliser une meacutethode agrave basede tables qui stocke le reacutesultat approcheacute de ces fonctions pour un ensemble drsquoarguments bien choisisDans le cadre du projet ANR MetaLibm (2013-2017) et de la thegravese de H de Lassus Saint-Geniegraves nousavons proposeacute une meacutethode qui permet de tabuler des valeurs exactes et ainsi reacuteduire la taille destables et acceacuteleacuterer le processus drsquoeacutevaluation [CACT19 CACT16]

La non-reproductibiliteacute numeacuterique du calcul parallegravele remet en question la fiabiliteacute et le degreacute deconfiance des simulations numeacuteriques de nombreux domaines drsquoapplication industrielle (chimie eacutenergeacute-tique ) ou de recherche (eacutetudes du climat du systegraveme solaire ) Le deacutebugage le test la validationou la certification par des autoriteacutes de controcircle imposent de corriger ce comportement essentiellementcauseacute par le non-deacuteterminisme des exeacutecutions parallegraveles (ordonnancement et reacuteductions dynamiques)la non-associativiteacute de lrsquoaddition de lrsquoarithmeacutetique flottante et la deacutependance entre la propagation deserreurs drsquoarrondis geacuteneacutereacutees et lrsquoordre des seacutequences de calcul [ART10] Nous appliquons le principedrsquoune augmentation cibleacutee de la preacutecision des calculs qui soit suffisante agrave la reproductibiliteacute numeacuteriquedans deux contextes diffeacuterents

Une premiegravere eacutetape est de pouvoir disposer de BLAS parallegraveles efficaces et numeacuteriquement re-productibles ces derniegraveres eacutetant les briques de base optimiseacutees de lrsquoalgegravebre lineacuteaire numeacuterique Deuxdirections ont eacuteteacute suivies Nous participons au deacuteveloppement de la bibliothegraveque exBLAS [ART6] quicible plus particuliegraverement les architectures massivement parallegraveles (GPU acceacuteleacuterateurs) Par ailleursdes BLAS de niveaux 1 et 2 preacutecises reproductibles et performantes baseacutees sur des algorithmes reacutecentsde sommation correctement arrondie sont aussi proposeacutees dans la bibliothegraveque RARE-BLAS (thegravese deC Chohra) [CACT8 CACT2 CACT3]

A large eacutechelle ensuite des techniques de compensation ont permis de retrouver la reproductibi-liteacute numeacuterique des simulations par eacuteleacutements finis du code drsquohydrodynamique industrielle open sourceTelemac-Mascaret (thegravese de R Nheili 2016) [CACT15 CACT18 CACT4]

5 Faits marquants

51 Prix et distinctions

mdash Best Paper Session pour lrsquoarticle Power Flow analysis under uncertainty using Symmetric FuzzyArithmetic agrave la confeacuterence IEEE PES-GM 2014

mdash Best Paper Award for GPU applications pour lrsquoarticle FuzzyGPU a fuzzy arithmetic libraryfor GPU agrave la confeacuterence PDP 2014

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 6: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

6 Rayonnement

61 Organisation drsquoeacuteveacutenements

mdash Workshop Numerical Reproducibility for High-Performance Computing 17th SIAM Conferenceon Parallel Processing for Scientific Computing Paris (2016)

mdash Mini-symposium Reproductibiliteacute numeacuterique congregraves annuel SMAI Seignosse (2013)mdash Rencontres Arithmeacutetique et Informatique Matheacutematique (RAIMrsquo16)mdash Ecole jeunes chercheurs du GDR Informatique Matheacutematique (EJCIMrsquo13)

62 Comiteacutes de programme et activiteacute eacuteditoriale

mdash Comiteacutes de programme de confeacuterences internationales et nationalesmdash Membre des comiteacutes de programme des confeacuterence PaCT (1517) PDP (13 14 17)

MCSoc (15 16 17) HPCS (16 17) PDCTA (17)mdash Membre des comiteacutes de programme de la confeacuterence Compas (eacuteditions 14 15 17)mdash Preacutesidence du track Archi de la confeacuterence Compas 2016

mdash Activiteacute eacuteditorialemdash Informatique-Matheacutematique une photo en 2013 2014 2017 Seacuterie publieacutee aux PUP puis

CNRS Editions creacuteation eacutedition du premier numeacutero comiteacute scientifique et eacuteditorialmdash )i(Interstices comiteacute eacuteditorial

63 Invitation

mdash Exposeacute inviteacute du track Archi de la confeacuterence Compas 2014 Neuchacirctel (Suisse)

7 Valorisation et transfert

71 Valorisations contractuelles

Actility (2013-2014) Cette collaboration avec la socieacuteteacute Actility concernait une eacutetude de faisabi-liteacute sur les gains en performance des acceacuteleacuterateurs mateacuteriels de type GPU pour une applicationde calcul de lrsquoeacutetat drsquoun reacuteseau de distribution eacutelectriqueLrsquoobjectif de cette eacutetude de faisabiliteacute eacutetait de rechercher et comparer diverses solutions lieacutees agravela probleacutematique du controcircle drsquoadmission au sein du logiciel DOME deacuteveloppeacute agrave UCLM avecpour objectif principal la performance Cette performance eacutetait neacutecessaire afin drsquoacceacuteleacuterer lestemps de simulation et pouvoir tendre vers des prises de deacutecision en temps reacuteel Nous avons pourcela eacutetudieacute lrsquoensemble de la chaicircne logicielle en proposant drsquoutiliser des processeurs graphiquescombineacutes agrave de nouveaux scheacutemas algorithmiques

3E (2015-2016) Cette collaboration avec la socieacuteteacute 3E concernait lrsquoexploitation par des techniquesde datamining des donneacutees issues des reacuteseaux de capteur que lrsquoon trouve dans les centralessolaires photovoltaiumlques

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 7: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Lrsquoobjectif de cette eacutetude eacutetait de modeacuteliser la performance des onduleurs photovoltaiumlques enfonction du temps agrave partir des donneacutees de terrain Les modegraveles viseacutes ont faciliteacute la deacutetectiondes effets de vieillissement et permis de quantifier les pertes associeacutees en permettant de preacutedirecertaines pannes

EDF RampD (2016-2017) Cette collaboration avec le LNHE et le Laboratoire National Saint-Venant (Chatou) concerne lrsquoameacutelioration de la reproductibiliteacute numeacuterique de modules du codedrsquohydrodynamique open TELEMAC-MASCARETLrsquoeacutetude a pour objectif drsquoameacuteliorer la reproductibiliteacute numeacuterique de ce code et plus particu-liegraverement le module drsquohydrodynamique bidimensionnelle TELEMAC2D Les sources de la non-reproductibiliteacute numeacuterique drsquoexeacutecutions parallegraveles de simulations de reacutefeacuterence (cas-test) incluesdans la distribution de TELEMAC2D ont drsquoabord identifieacutees De nouvelles solutions algorith-miques qui ameacuteliorent la reproductibiliteacute numeacuterique de ces traitements dans un environnementde calcul parallegravele ont eacuteteacute deacutefinies impleacutementeacutees et valideacutees sur ces cas-tests Ces solutions sontinteacutegreacutees dans la distribution 2017 d open TELEMAC-MASCARET

72 Expertises et transfert technologique

mdash Membre du Conseil drsquoOrientation Scientifiques Techniques et Industriels de la reacutegion Languedoc-Roussillon Midi-Pyreacuteneacutees (COSTI)

8 Collaborations

81 Projets collaboratifs

mdash ANR mdash ANR INS DEFIS (2011-2015)mdash ANR INS CAFEIN (2012-2015)mdash ANR Pavois (2012-2015)mdash ANR MetaLibm (2014-2017)

mdash CNRS PEPS QUARENUM (2013)

82 Autres collaborations

mdash University of Wollongong (Australie) seacutejour de 10 mois en 2014-2015 drsquoun doctorant agrave lrsquoUni-versiteacute de Wollongong financeacute par Thlexinoe Seacutejour drsquoun mois de T Plantard agrave DALI en 2015aussi financeacute par Thelxinoe

mdash University College Dublin co-tutelle de la thegravese de M Marin (2012-2015)mdash Deacutepartement MIC (LIRMM) co-direction (avec G Sassatelli deacutepartement MIC) de la thegravese de

K Porada sur lrsquoeacutevaluation drsquoun modegravele de processeur paralleacutelisant projet europeacuteen MontBlanc2

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 8: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

9 Production scientifique

91 Cinq publications majeures

mdash D Defour and E Petit A software scheduling solution to avoid corrupted units on GPUsJournal of Parallel and Distributed Computing 90-91 1ndash8 Apr 2016

Reacutesumeacute Les processeurs modernes sont de plus en plus sujets aux deacutefaillances mateacuterielles Ces deacute-faillances sont dues agrave diffeacuterents facteurs lieacutes agrave la tension la freacutequence ou le processus de gravure destransistors Ces erreurs peuvent ecirctre permanentes transitoires ou intermittentes Leurs nombres et leursfreacutequences drsquoapparitions augmentent avec le vieillissement des puces Il est donc neacutecessaire de composeravec le fait qursquoune architecture tel qursquoun GPU agrave lrsquoorigine fiable devienne non-fiable avec le temps Nousavons proposeacute une solution logicielle (middleware) permettant de contenir le calcul sur les uniteacutes valideset eacuteviter les uniteacutes probleacutematiques en exploitant les speacutecificiteacutes du modegravele de programmation des GPU

mdash B Goossens D Parello K Porada and D Rahmoune Toward a Core Design to Distributean Execution on a Many-Core Processor In V Malyshkin editor PaCT Parallel ComputingTechnologies volume LNCS of Parallel Computing Technologies pages 390ndash404 PetrozavodskRussia Aug 2015 Springer International Publishing

Reacutesumeacute Lrsquoarticle preacutesente un modegravele drsquoexeacutecution parallegravele et une conception de processeur agrave plusieurscoeurs pour exeacutecuter des programmes C en parallegravele Le modegravele construit automatiquement des sectionsparallegraveles drsquoinstructions machine agrave partir de la trace drsquoexeacutecution Il parallegravelise la lecture le renommagelrsquoexeacutecution et le retrait des instructions La lecture drsquoinstruction nrsquoest pas baseacutee sur un preacutedicteur desaut mais par un eacutetage de lecture-deacutecodage-et-exeacutecution partielle capable de calculer en ordre la plupartdes instructions de controcircle Le meacutecanisme de renommage des registres de Tomasulo est eacutetendu agrave lameacutemoire avec une technique permettant de faire correspondre les paires consommateur producteur Letampon de reacuteorganisation (ROB) est adapteacute pour permettre le retrait en parallegravele des instructions Lemodegravele est preacutesenteacute sur un exemple de reacuteduction de somme qui est eacutegalement utiliseacute pour une eacutevaluationanalytique du potentiel de performance du modegravele

mdash P Langlois R Nheili and C Denis Recovering numerical reproducibility in hydrodynamicsimulations In ARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley SantaClara CA United States July 2016

Reacutesumeacute Les simulations HPC souffrent de non-reproductibiliteacute numeacuterique agrave cause de faiblesses delrsquoarithmeacutetique flottante Des distributions diffeacuterentes drsquoun calcul parallegravele peuvent fournir des reacutesultatsnumeacuteriques diffeacuterents Nous nous inteacuteressons agrave des simulations drsquohydrodynamique par eacuteleacutements finisavec le logiciel openTelemac ougrave le paralleacutelisme repose sur de la deacutecomposition de domaines Une deseacutetapes principales drsquoune telle simulation est la construction drsquoun sytegraveme lineacuteaire de grande taille puis sareacutesolution Ici lrsquoeacutetape de construction est baseacutee sur un stockage eacuteleacutement-par-eacuteleacutement et la reacutesolution surlrsquoalgorithme du gradient conjugueacute Le paralleacutelisme de sous-domaine est imbriqueacute dans ces eacutetapes Nouseacutetudions pourquoi la reproductibiliteacute numeacuterique est perdue dans ce traitement et quelles opeacuterationsdoivent ecirctre corrigeacutees Nous deacutetaillons comment les techniques de compensation permettent drsquoobtenirune reacutesolution numeacuteriquement reproductible Nous illustrons cette approche en preacutesentant une versionreproductible pour un cas de simulation fourni avec la distribution du logiciel openTelemac

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 9: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

mdash C Negre and J-M Robert New Parallel Approaches for Scalar Multiplication in Elliptic Curveover Fields of Small Characteristic IEEE Transactions on Computers 64(10) 2875ndash2890 Sept2015

Reacutesumeacute Nous preacutesentons deux nouvelles strateacutegies pour la mise en œuvre parallegravele de la multiplicationscalaire sur les courbes elliptiques Nous introduisons drsquoabord une variante de la multiplication scalairede Montgomery exploitant le halving de point sur E(GF (2m)) Le Montgomery-halving peut ecirctre exeacute-cuteacute en parallegravele avec la multiplication scalaire de Montgomery afin de calculer de faccedilon concourante unepartie de la multiplication scalaire Nous preacutesentons eacutegalement deux formules pour le thirding de pointdans une sous-famille de courbes E(GF (3m)) Nous utilisons ces formules pour impleacutementer la multi-plication scalaire agrave travers une approche de type third-and-add et une approche parallegravele third-and-addet double-and-add ou triple-and-add Nous fournissons eacutegalement quelques reacutesultats drsquoimplantation surun Intel Core i7 des deux strateacutegies proposeacutees qui montrent une acceacuteleacuteration de 5 -13 par rapportaux approches non paralleacuteliseacutees

mdash G Revy Automated design of floating-point logarithm functions on integer processors InARITH 23 IEEE Symposium on Computer Arithmetic Silicon Valley Santa Clara CA Uni-ted States July 2016

Reacutesumeacute De nos jours la conception automatiseacutee drsquoimplantations efficaces de fonctions eacuteleacutementaires(comme cos sin log exp ) en arithmeacutetique flottante et avec arrondi correct est un reacuteel challenge Eneffet la diversiteacute des architectures mateacuterielles et des formats de donneacutees flottants rend ce processusdrsquoimplantation fastidieux Cet article srsquointeacuteresse au cas particulier de la fonction logb(x) sur proces-seurs entiers Premiegraverement il propose une reacuteduction drsquoargument unifieacutee pour logb(x) qui permet dereacuteduire lrsquoeacutevaluation de ces fonctions agrave celle drsquoun seul polynocircme bien choisi Deuxiegravemement il donnedes conditions suffisantes sur les erreurs drsquoapproximation et drsquoeacutevaluation pour garantir lrsquoarrondi correctde lrsquoimplantation Et troisiegravemement il montre comment automatiser le processus drsquoimplantation de lafonction logb(x) sur processeurs entiers pour b isin 2 exp(1) 10 Finalement nous montrons que cetteapproche automatiseacutee permet drsquoacceacuteleacuterer la conception drsquoimplantations efficaces de logb(x) pour lesformats de donneacutees standards

92 HDR et thegraveses

Sur la peacuteriode mdash 2 HDR soutenuesmdash 5 thegraveses soutenuesmdash 3 thegraveses en cours

Devenir des docteurs (soutenance sur la peacuteriode) mdash 1 chercheur MathWorks (Cambridge GB)mdash 1 post-doctorant agrave lrsquoUniversiteacute de Liegravege (Institut Montefiore Deacutepartement drsquoElectriciteacute Elec-

tronique amp Informatique)mdash 2 post-doctorants en France (LIP DALI)mdash 1 chercheur statutaire associeacute (DALI et rectorat de Montpellier)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 10: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

93 Logiciels

CGPE (Code Generation for Polynomial Evaluation) est un outil logiciel qui permet de syntheacutetiserdu code rapide (optimiseacute pour une architecture cible) et certifieacute pour lrsquoeacutevaluation drsquoexpressionsmatheacutematiques (polynocircmes univarieacutes et bivarieacutes produits scalaires sommes) Il permet la syn-thegravese de codes pour les arithmeacutetiques agrave virgule fixe et flottante ou bien la description drsquounearchitecture en VHDL CGPE a notamment deacutejagrave eacuteteacute utiliseacute pour eacutecrire automatiquement envi-ron 50 du code de la bibliothegraveque FLIP optimiseacutee pour le ST231 (processeur entier VLIW 4voies de ST Microelectronics)Distribueacute sous licence CeCILL v-2 et accessible agrave http webdaliuniv-perpfrlogicielsphp

exBLAS est une bibliothegraveque C++OpenCL de routines drsquoalgegravebre lineacuteaire (BLAS) permettantde calculer de faccedilon reproductible et preacutecise sur les architectures multicœurs (GPU Intel XeonPhi)6000 lignes de code accessibles agrave https exblaslip6fr

FLIP (Floating-point Library for Integer Processor) est un outil logiciel pour la synthegravese de codescertifieacutes pour lrsquoeacutevaluation de certains blocs de base drsquoalgegravebre lineacuteaire en virgule fixe Il permeten particulier drsquoeacutecrire automatiquement du code pour la multiplication de matrices ou bienlrsquoinversion de matrices agrave base de deacutecomposition de Cholesky FPLA repose sur CGPE qursquoilutilise en backendAccessible agrave http webdaliuniv-perpfrlogicielsphp

FPLA (Fixed-Point Linear Algebra) est une bibliothegraveque C qui fournit un support logiciel pourlrsquoarithmeacutetique flottante simple preacutecision (binary32) aux processeurs entiers Elle propose no-tamment une implantation logicielle des 5 opeacuterations de base avec nombres deacutenormaliseacutes etpour les 4 modes drsquoarrondi requis par le standard IEEE 754-2008 Cette bibliothegraveque cible par-ticuliegraverement les processeurs VLIW et DSP Elle a eacuteteacute valideacutee sur les processeurs de la familleST200 de ST MicroelectronicsAccessible agrave http webdaliuniv-perpfrlogicielsphp

FuzzyGPU est une bibliothegraveque C++OpenCL drsquoopeacuterateurs arithmeacutetiques permettant de geacutererles nombres flous symeacutetriques2000 lignes de code accessible agrave https codegooglecompfuzzy-gpu

GPUBurn est une bibliothegraveque C++OpenCLCUDA drsquooutils permettant de tester et localiserles erreurs intermittentes des GPU et de confiner le calcul aux seules uniteacutes saines1500 lignes de code accessibles agrave https codegooglecompgpuburn

RARE-BLAS (Reproducible and Accurately Rounded BLAS) fournit une impleacutementation de lrsquoin-terface BLAS correctement arrondie pour le format binary64 de lrsquoIEEE754 Elle exploite defaccedilon et optimiseacutee et transparente pour lrsquoutilisateur les algorithmes de sommation reacutecents lesplus efficaces Des calculs en preacutecisions intermeacutediaires sont optimiseacutes pour garantir la meilleurepreacutecision et la meilleure performance Cette bibliothegraveque parallegravele CopenMPMPI fournit re-productibiliteacute et preacutecision sur les architectures multicœurs (CPU ou acceacuteleacuterateur Intel XeonPhi)Accessible agrave http webdaliuniv-perpfrlogicielsphp

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 11: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

10 Implication FormationRecherche

mdash Coordination scientifique du meacutesocentre HPCLRmdash Co-organisation drsquoune seacuterie de 10 formationsan sur le HPC impliquant industriels et acadeacute-

miques pour le meacutesocentre HPCLRmdash Interventions dans les eacutecoles theacutematiques du CNRS Archi (2013 2015 2017) eacutecoles GIPSALAB

(eacuteteacute 2013 hiver 2015) EJCIM (2013)mdash Coordination et animations drsquoateliers aux manifestations de meacutediation scientifique (village des

sciences )mdash Conseil de lrsquoEcole Doctorale ED 305 (UPVD)

11 Implication dans les structures

mdash GDR Informatique Matheacutematique comiteacute de directionmdash GDR Informatique Matheacutematique responsabiliteacute du groupe de travail Arithmdash UPVD direction du deacutepartement Matheacutematiques-Informatique UPVD (2012-2014)mdash UPVD vice-preacutesidence UPVD (VP Valorisation jusqursquoen 2015)mdash UPVD comiteacute de pilotage du Contrat Enseignant Peacutedagogie Innovante (CEPI)mdash UPVD mandats eacutelectifs aux CAC et CUFR responsabiliteacutes de diplocircmes et preacutesidences de jury

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 12: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Publications 2013 ndash 2016

Articles dans des revues internationales

[ART1] C Negre et T Plantard ldquoEfficient Regular Modular Exponentiation Using Multi-plicative Half-Size Splittingrdquo In Journal of Cryptographic Engineering (2016) doi 101007s13389-016-0134-5 url httpshalarchives-ouvertesfrhal-01185249

[ART2] M Martel M A Najahi et G Revy ldquoTrade-offs of certified fixed-point code synthesisfor linear algebra basic blocksrdquo In Journal of Systems Architecture (deacutec 2016) doi 101016jsysarc201611010 url httpshal-lirmmccsdcnrsfrlirmm-01279628

[ART3] M Marin D Defour et F Milano ldquoAn efficient representation format for fuzzyintervals based on symmetric membership functionsrdquo In ACM Transactions on Mathe-matical Software 433 (oct 2016) 23 1ndash23 22 doi 1011452939364 url httpshal-lirmmccsdcnrsfrlirmm-01385459

[ART4] L Theacutevenoux P Langlois et M Martel ldquoAutomatic source-to-source error com-pensation of floating-point programs code synthesis to optimize accuracy and timerdquoIn Concurrency and Computation Practice amp Experience (aoucirct 2016) doi 101002cpe3953 url httpshalarchives-ouvertesfrhal-01236919

[ART5] D Defour et E Petit ldquoA software scheduling solution to avoid corrupted units onGPUsrdquo In Journal of Parallel and Distributed Computing (feacutev 2016) In Press doi 101016jjpdc201601001 url httpshal-lirmmccsdcnrsfrlirmm-01267742

[ART6] S Collange D Defour S Graillat et R Iakymchuk ldquoNumerical Reproducibi-lity for the Parallel Reduction on Multi- and Many-Core Architecturesrdquo In ParallelComputing 49 (nov 2015) p 83ndash97 doi 101016jparco201509001 url httpshal-lirmmccsdcnrsfrlirmm-01206348

[ART7] C Negre et J-M Robert ldquoNew Parallel Approaches for Scalar Multiplication inElliptic Curve over Fields of Small Characteristicrdquo In IEEE Transactions on Computers6410 (sept 2015) p 2875ndash2890 doi 101109TC20152389817 url httpshalarchives-ouvertesfrhal-00908463

[ART8] M Franccedilois T Grosges D Barchiesi et R Erra ldquoPseudo-random number gene-rator based on mixing of three chaotic mapsrdquo In Communications in Nonlinear Scienceand Numerical Simulation 194 (2014) p 887ndash895 doi 101016jcnsns201308032 url httpshalinriafrhal-00936657

[ART9] M Cenk A Hasan et C Negre ldquoEfficient Subquadratic Space Complexity BinaryPolynomial Multipliers Based On Block Recombinationrdquo In IEEE Transactions onComputers 639 (sept 2014) p 2273ndash2287 doi 101109TC2013105 url httpshalinriafrhal-00712090

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 13: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[ART10] F Jeacutezeacutequel P Langlois et N Revol ldquoFirst steps towards more numerical reproduci-bilityrdquo In ESAIM Proceedings ESAIM Proceedings 45 (sept 2014) p 229ndash238 doi 101051proc201445023 url httpshal-lirmmccsdcnrsfrlirmm-00872562

[ART11] M Franccedilois D Defour et C Negre ldquoA Fast Chaos-Based Pseudo-Random BitGenerator Using Binary64 Floating-Point Arithmeticrdquo In Informatica 382 (juil 2014)p 115ndash124 url httpshalarchives-ouvertesfrhal-01024689

[ART12] C Negre ldquoEfficient Binary Polynomial Multiplication Based on Optimized KaratsubaReconstructionrdquo In Journal of Cryptographic Engineering 42 (juil 2014) p 91ndash106doi 101007s13389-013-0066-2 url httpshalinriafrhal-00724778

[ART13] M Cenk C Negre et A Hasan ldquoImproved Three-Way Split Formulas for BinaryPolynomial and Toeplitz Matrix Vector Productsrdquo In IEEE Transactions on Computers627 (juil 2013) p 1345ndash1361 url httpshalarchives- ouvertesfrhal-00839945

[ART14] A Hasan et C Negre ldquoMultiway Splitting Method for Toeplitz Matrix Vector Pro-ductrdquo In IEEE Transactions on Computers 627 (juil 2013) p 1467ndash1471 doi 101109TC201295 url httpshalarchives-ouvertesfrhal-00839952

[ART15] J Adikari A Barsoum A Hasan A H Namin et C Negre ldquoImproved Area-TimeTrade-offs for Field Multiplication using Optimal Normal Basesrdquo In IEEE Transactionson Computers 621 (jan 2013) p 193ndash199 doi 101109TC2011198 url httpshalarchives-ouvertesfrhal-00813784

Confeacuterences avec actes - audience internationale

[CACT1] R Nheili P Langlois et C Denis ldquoFirst improvements toward a reproducible Telemac-2Drdquo In XXIIIrd TELEMAC-MASCARET User Conference Paris France oct 2016url httpshal-lirmmccsdcnrsfrlirmm-01371152

[CACT2] C Chohra P Langlois et D Parello ldquoParallel experiments with RARE-BLASrdquoIn SYNASC Symbolic and Numeric Algorithms for Scientific Computing TimisoaraRomania sept 2016 url httphal-lirmmccsdcnrsfrlirmm-01349698

[CACT3] C Chohra P Langlois et D Parello ldquoReproducible Accurately Rounded andEfficient BLASrdquo In REPPAR Reproducibility in Parallel Computing Grenoble Franceaoucirct 2016 url httphal-lirmmccsdcnrsfrlirmm-01280324

[CACT4] P Langlois R Nheili et C Denis ldquoRecovering numerical reproducibility in hydrody-namic simulationsrdquo In ARITH Computer Arithmetic Silicon Valley Santa Clara CAUnited States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01274671

[CACT5] A Lesavourey C Negre et T Plantard ldquoEfficient Randomized Regular Modu-lar Exponentiation using Combined Montgomery and Barrett Multiplicationsrdquo In SE-CRYPT Security and Cryptography Lisbon Portugal juil 2016 url httpshalarchives-ouvertesfrhal-01330898

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 14: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[CACT6] T Plantard et J-M Robert ldquoEnhanced Digital Signature using RNS Digit ExponentRepresentationrdquo In International Workshop on the Arithmetic of Finite Fields WAIFI2016 lncs Department of Mathematics of Ghent University Gand Belgium Springerjuil 2016 url httpshalarchives-ouvertesfrhal-01337561

[CACT7] G Revy ldquoAutomated design of floating-point logarithm functions on integer processorsrdquoIn ARITH 23 Silicon Valley Santa Clara CA United States juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01276677

[CACT8] C Chohra P Langlois et D Parello ldquoEfficiency of Reproducible Level 1 BLASrdquoIn t 9553 Scientific Computing Computer Arithmetic and Validated Numerics 16thInternational Symposium SCAN 2014 Wuumlrzburg Germany September 21-26 2014Revised Selected Papers springer avr 2016 doi 101007978-3-319-31769-4_8url httphal-lirmmccsdcnrsfrlirmm-01101723

[CACT9] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

[CACT10] B Goossens D Parello K Porada et D Rahmoune ldquoParallel Locality and Pa-rallelization Qualityrdquo In PMAM Programming Models and Applications for Multicoresand Manycores Barcelona Spain mar 2016 doi 10114528834042883410 url httpshalarchives-ouvertesfrhal-01252007

[CACT11] L Theacutevenoux P Langlois et M Martel ldquoAutomatic Source-to-Source Error Com-pensation of Floating-Point Programsrdquo In CSE Computational Science and Enginee-ring Porto Portugal oct 2015 doi 101109CSE201511 url httpshalarchives-ouvertesfrhal-01158399

[CACT12] D Defour ldquoMeasuring predictability of Nvidiarsquos GPU warp and block schedulers Application to the summation problemrdquo In IEEE 9th International Symposium onEmbedded MulticoreMany-core Systems-on-Chip (MCSoC-15) Turin Italy sept 2015p 17ndash24 doi 101109MCSoC20159 url httpshalarchives-ouvertesfrhal-01267747

[CACT13] D Defour et S Collange ldquoReproducible floating-point atomic addition in data-parallel environmentrdquo In ACSIS Annals of Computer Science and Information Sys-tems T 5 Lodz Poland sept 2015 p 721ndash728 doi 10154392015F86 url httpshalarchives-ouvertesfrhal-01267755

[CACT14] B Goossens D Parello K Porada et D Rahmoune ldquoToward a Core Design toDistribute an Execution on a Many-Core Processorrdquo In PaCT Parallel ComputingTechnologies Sous la dir de V Malyshkin T LNCS Parallel Computing Technologies9251 Petrozavodsk Russia Springer International Publishing aoucirct 2015 p 390ndash404doi 101007978-3-319-21909-7_38 url httpshalarchives-ouvertesfrhal-01152664

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 15: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[CACT15] P Langlois R Nheili et C Denis ldquoNumerical Reproducibility Feasibility IssuesrdquoIn NTMS New Technologies Mobility and Security Sous la dir de M Badra ABoukerche et P Urien Paris France juil 2015 doi 101109NTMS20157266509url httphal-lirmmccsdcnrsfrlirmm-01141852

[CACT16] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoRange Reduction Based onPythagorean Triples for Trigonometric Function Evaluationrdquo In ASAP Application-Specific Systems Architectures and Processors Toronto Canada IEEE juil 2015 p 74ndash81 doi 101109ASAP20157245712 url httpshalarchives-ouvertesfrhal-01134232

[CACT17] C Negre et J-M Robert ldquoParallel Approaches for Efficient Scalar Multiplication overElliptic Curverdquo In SECRYPT International Conference on Security and CryptographyColmar France SciTePress juil 2015 p 202ndash209 doi 1052200005512502020209url httpshalarchives-ouvertesfrhal-01206530

[CACT18] R Nheili P Langlois et C Denis ldquoNumerical Reproducibility in open TELEMAC A Case Study within the Tomawac Libraryrdquo In 2nd International Workshop on HighPerformance Computing Simulation in EnergyTransport Domains (HPCSET 2015) ISCHigh Performance 2015 Conference Frankfurt Germany juil 2015 url httphal-lirmmccsdcnrsfrlirmm-01101715

[CACT19] H de Lassus Saint-Geniegraves D Defour et G Revy ldquoReacuteduction drsquoargument baseacutee surles triplets pythagoriciens pour lrsquoeacutevaluation de fonctions trigonomeacutetriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Lille France juin 2015 url httphal-lirmmccsdcnrsfrlirmm-01136772

[CACT20] C Negre et G Perin ldquoTrade-off Approaches for Leak Resistant Modular Arithmeticin RNSrdquo In ACISP Australasian Conference on Information Security and PrivacySous la dir drsquoE Foo et D Stebila T LNCS Information Security and Privacy 9144Brisbane Australia Springer juin 2015 p 107ndash124 doi 101007978-3-319-19962-7_7 url httpshalarchives-ouvertesfrhal-01143367

[CACT21] C Negre T Plantard et J-M Robert ldquoEfficient Modular Exponentiation Based onMultiple Multiplications by a Common Operandrdquo In ARITH Computer ArithmeticINRIA Lyon France juin 2015 p 144ndash151 doi 101109ARITH201524 url httphal-lirmmccsdcnrsfrlirmm-01142327

[CACT22] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible TriangularSolvers for High-Performance Computingrdquo In ITNG Information Technology - NewGenerations Las Vegas NV United States avr 2015 p 353ndash358 doi 101109ITNG201563 url httpshal-lirmmccsdcnrsfrlirmm-01206371

[CACT23] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 16: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[CACT24] J-M Robert ldquoSoftware Implementation of Parallelized ECSM over Binary and PrimeFieldsrdquo In Inscrypt Information Security and Cryptology T LNCS 8957 BeijingChina Springer deacutec 2014 p 445ndash462 doi 101007978-3-319-16745-9_24 url httpshalarchives-ouvertesfrhal-00998277

[CACT25] M Martel M A Najahi et G Revy ldquoToward the synthesis of fixed-point code formatrix inversion based on Cholesky decompositionrdquo In DASIP Design and Architec-tures for Signal and Image Processing Madrid Spain IEEE oct 2014 p 1ndash8 doi 101109DASIP20147115609 url httpshal-lirmmccsdcnrsfrlirmm-01212806

[CACT26] C Chohra P Langlois et D Parello ldquoLevel 1 Parallel RTN-BLAS Implementationand Efficiency Analysisrdquo In SCAN Scientific Computing Computer Arithmetic andValidated Numerics Wurzburg Germany sept 2014 url httphal-lirmmccsdcnrsfrlirmm-01095172

[CACT27] C Mouilleron M A Najahi et G Revy ldquoAutomated Synthesis of Target-DependentPrograms for Polynomial Evaluation in Fixed-Point Arithmeticrdquo In SYNASC Sym-posium on Symbolic and Numeric Algorithms for Scientific Computing Timisoara Ro-mania sept 2014 p 141ndash148 doi 101109SYNASC201427 url httpshal-lirmmccsdcnrsfrlirmm-00814338

[CACT28] S Collange D Defour S Graillat et R Iakymchuk ldquoA Reproducible AccurateSummation Algorithm for High-Performance Computingrdquo In EX Exascale AppliedMathematics Challenges and Opportunities Chicago United States juil 2014 url httpshalarchives-ouvertesfrhal-01267825

[CACT29] M Marin D Defour et F Milano ldquoPower Flow Analysis under Uncertainty usingSymmetric Fuzzy Arithmeticrdquo In PES General Meeting 2014 | Conference amp ExpositionNational Harbor MD United States IEEE juil 2014 p 1ndash5 doi 101109PESGM20146939274 url httpshal-lirmmccsdcnrsfrlirmm-01206373

[CACT30] D Defour ldquoImpact des schedulers sur la preacutedictibiliteacute dans les GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Sous la dir de P Felber L Phi-lippe E Riviere et A Tisserand Neuchacirctel Switzerland avr 2014 url httpshalarchives-ouvertesfrhal-00951916

[CACT31] M Franccedilois D Defour et P Berthomeacute ldquoA Pseudo-Random Bit Generator Basedon Three Chaotic Logistic Maps and IEEE 754-2008 Floating-Point Arithmeticrdquo In Theory and Applications of Models of Computation Sous la dir de T Gopal A L A BCooper et M Agrawal LNCS 8402 Chennai India Springer avr 2014 p 229ndash247 doi 10 1007 978 - 3 - 319 - 06089 - 7 _16 url https hal archives -ouvertesfrhal-00985357

[CACT32] K Porada D Parello et B Goossens ldquoAnalyse et reacuteduction du chemin critique danslrsquoexeacutecution drsquoune applicationrdquo In ComPAS Confeacuterence en Paralleacutelisme Architectureet Systegraveme Neuchacirctel Switzerland avr 2014 url httpshalinriafrhal-01158433

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 17: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[CACT33] M Marin et D Defour ldquoFuzzyGPU a fuzzy arithmetic library for GPUrdquo In PDP Parallel Distributed and Network-Based Processing Torino Italy IEEE feacutev 2014p 624ndash631 doi 101109PDP201416 url httpshal-lirmmccsdcnrsfrlirmm-01206375

[CACT34] M Martel M A Najahi et G Revy ldquoCode Size and Accuracy-Aware Synthesis ofFixed-Point Programs for Matrix Multiplicationrdquo In PECCS Pervasive and EmbeddedComputing and Communication Systems Lisbonne Portugal jan 2014 doi 1052200004884802040214 url httpshal-lirmmccsdcnrsfrlirmm-00860383

[CACT35] E Petit et D Defour ldquoGPUburn A System to Test and Mitigate GPU HardwareFailuresrdquo In SAMOS Embedded Computer Systems Architectures Modeling andSimulation Samos Greece juil 2013 p 263ndash270 doi 101109SAMOS20136621133url httpshalarchives-ouvertesfrhal-00827588

[CACT36] D Defour et M Marin ldquoRegularity versus Load-Balancing on GPU for treefix com-putationsrdquo In ICCS International Conference on Computational Science T 18 Bar-celone Spain juin 2013 p 309ndash318 url httpshalarchives-ouvertesfrhal-00768293

[CACT37] A Ioualalen et M Martel ldquoSynthesizing Accurate Floating-Point Formulasrdquo In ASAP Application-Specific Systems Architectures and Processors Washington DCUnited States IEEE juin 2013 p 113ndash116 doi 101109ASAP20136567563 url httpshalarchives-ouvertesfrhal-00835736

[CACT38] C Negre et J-M Robert ldquoImpact of Optimized Operations ABAC and AB+CD inScalar Multiplication over Binary Elliptic Curverdquo In AFRICACRYPT Cryptology inAfrica T LNCS Progress in Cryptology ndash AFRICACRYPT 2014 8469 Cairo Egyptjuin 2013 p 13ndash30 doi 101007978-3-642-38553-7_16 url httpshalinriafrhal-00724785

[CACT39] P Langlois B Goossens et D Parello ldquoTowards a Reliable Performance Evaluationof Accurate Summation Algorithmsrdquo In SCE Computational Science and EngineeringSIAM Boston Ma United States feacutev 2013 url httpshalarchives-ouvertesfrhal-01233879

Autres confeacuterences

[COMN1] R S Iakymchuk S S Graillat D Defour et E S Quintana-Ortiacute ldquoHierar-chical Approach for Deriving a Reproducible LU factorization on GPUsrdquo In The Nu-merical Reproducibility at Exascale (NRE16) workshop held as part of the Supercompu-ting Conference (SC16) Salt Lake City UT United States nov 2016 url httpshalarchives-ouvertesfrhal-01382645

[COMN2] H de Lassus Saint-Geniegraves et G Revy ldquoPerformances de scheacutemas drsquoeacutevaluation po-lynomiale sur architectures vectoriellesrdquo In ComPAS Confeacuterence en ParalleacutelismeArchitecture et Systegraveme Laboratoire des Sciences et Techniques de lrsquoInformation de laCommunication et de la Connaissance (Lab-STICC) Lorient France juil 2016 url httpshal-lirmmccsdcnrsfrlirmm-01324740

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 18: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[COMN3] R Iakymchuk S Collange D Defour et S Graillat ldquoExBLAS Reproducibleand Accurate BLAS Libraryrdquo In NRE Numerical Reproducibility at Exascale AustinTX United States nov 2015 url httpshalarchives- ouvertesfrhal-01202396

[COMN4] R Iakymchuk S Collange D Defour et S Graillat ldquoReproducibility and Ac-curacy for High-Performance Computingrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140531

[COMN5] M Marin D Defour et F Milano ldquoAn efficient midpoint-radius implementationto handle symmetric fuzzy intervalsrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoIn-formatique Matheacutematique Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01140504

[COMN6] M A Najahi ldquoSynthesis of certified programs in fixed-point arithmetic and its appli-cation to linear algebra basic blocksrdquo In RAIM Rencontres Arithmeacutetiques de lrsquoInfor-matique Matheacutematique Rennes France avr 2015 url httpshal-lirmmccsdcnrsfrlirmm-01277374

[COMN7] R Nheili P Langlois et C Denis ldquoSolutions to ensure the reproducibility of thedigital simulation of the effect of waves on the coastrdquo In RAIM Rencontres Arithmeacute-tiques de lrsquoInformatique Matheacutematique Rennes France avr 2015 url httphal-lirmmccsdcnrsfrlirmm-01179997

[COMN8] J-M Robert ldquoAlgorithmes Parallegraveles de Multiplication Scalaire Optimiseacutee sur CourbesElliptiques Binairesrdquo In C2 Journeacutees Codage et Cryptographie GT-C2 Les Sept-LauxFrance mar 2014 url httphal-lirmmccsdcnrsfrlirmm-01121960

[COMN9] D Defour et E Petit ldquoTempeacuteratures erreurs mateacuterielles et GPUrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 p 1ndash11 url httpshalarchives-ouvertesfrhal-00785386

[COMN10] D Parello B Goossens et P Langlois ldquoAmeacuteliorer lrsquoanalyse de la performancedes algorithmes numeacuteriquesrdquo In ComPAS Confeacuterence en Paralleacutelisme Architecture etSystegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762550

[COMN11] D Parello P Langlois et B Goossens ldquoSur la reproductibiliteacute des mesures desperformances drsquoalgorithmes numeacuteriques avec PerPIrdquo In ComPAS Confeacuterence en Pa-ralleacutelisme Architecture et Systegraveme Grenoble France jan 2013 url httpshal-lirmmccsdcnrsfrlirmm-00762024

Confeacuterences inviteacutees

[INV1] R Iakymchuk D Defour S Collange et S Graillat ldquoReproducible and AccurateAlgorithms for Numerical Linear Algebrardquo In PP Parallel Processing for ScientificComputing Paris France SIAM avr 2016 url httpshal-lirmmccsdcnrsfrlirmm-01268048

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 19: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

[INV2] P Langlois C Chohra et R Nheili ldquoCas drsquoeacutetudes de calculs parallegraveles numeacute-riquement reproductiblesrdquo In Retour drsquoexpeacuteRiences sur la Recherche ReproductibleMISCCaSciModOT Orleacuteans France deacutec 2015 url httpshal- lirmmccsdcnrsfrlirmm-01240737

[INV3] C Negre et J-M Robert ldquoRecent Advances in Parallel Implementations of ScalarMultiplication over Binary Elliptic Curvesrdquo In RAIM Rencontres Arithmeacutetiques delrsquoInformatique Matheacutematique ATisserand and D Menard and S Duquesne and S Col-lange and N SaintPierre Rennes France avr 2015 url httpshalarchives-ouvertesfrhal-01141628

Direction drsquoouvrages et de proceedings

[DOUV1] P Langlois Informatique Matheacutematique une photographie en 2013 Sous la dir de PLanglois Etudes Presses Universitaires de Perpignan avr 2013 p 283 url httpshal-lirmmccsdcnrsfrlirmm-00835506

Chapitres drsquoouvrages

[COUV1] D Defour et M Marin ldquoSimulation temps reacuteel de reacuteseaux eacutelectriques agrave lrsquoaide desarchitectures multicœursrdquo In UPVD Magazine Hors-Seacuterie recherche 3 2014 p 42ndash44url httpshalarchives-ouvertesfrhal-01267852

[COUV2] D Defour et M Marin ldquoOptimiser la repreacutesentation des flottantsrdquo In HPC TodayT 4 Juin 2013 p 65ndash70 url httpshalarchives-ouvertesfrhal-01267953

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 20: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Liste des thegraveses et HDR 2013 ndash 2016

Thegraveses soutenues

mdash Laurent Theacutevenoux Soutenance juillet 2014Synthegravese de code avec compromis entre performance et preacutecision en arithmeacutetique flottante IEEE754Encadrement Ph Langlois M Martelseptembre 2010 rarr juillet 2014mdash Financement 1 sur programme chercheur drsquoavenir Reacutegion (36 mois)mdash Financement 2 sur emploi ATER (11 mois)

mdash Amine Najahi Soutenance deacutecembre 2014Synthesis of certified programs in fixed-point arithmetic and its application to linear algebrabasic blocksEncadrement M Martel G Revynovembre 2011 rarr deacutecembre 2014mdash Financement 1 par creacutedits ANR (34 mois)mdash Financement 2 sur emploi ATER (4 mois)

mdash Manuel Marin Soutenance deacutecembre 2015GPU-enhanced power flow analysisEncadrement D Defour F Milanoseptembre 2012 rarr deacutecembre 2015mdash Financement par Ecole Doctorale ED305 (36 mois)

mdash Jean-Marc Robert Soutenance deacutecembre 2015Contrer lrsquoattaque Simple Power Analysis efficacement dans les applications de la cryptographieasymeacutetrique algorithmes et implantationsEncadrement B Goossens Ch Negreseptembre 2012 rarr deacutecembre 2015mdash Financement par creacutedits ANR (40 mois)

mdash Rafife Nheili Soutenance deacutecembre 2016How to improve the numerical reproducibility of hydrodynamics simulations analysis and so-lutions for one open-source HPC softwareEncadrement Ph Langlois Ch Denis (EDF RampD)novembre 2013 rarr deacutecembre 2016mdash Financement 1 sur programme Erasmus Peace 2 (30 mois)mdash Financement 2 sur contrat de recherche avec EDF RampD (6 mois)

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 21: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Thegraveses en cours

mdash Chemseddine Chohra 4eme anneacutee Soutenance le 10 mars 2017Towards Reproducible Accurately Rounded and Efficient BLASEncadrement Ph Langlois D Parelloseptembre 2013 rarr mars 2017mdash Financement sur programme drsquoexcellence du gouvernement Algeacuterien (39 mois)

mdash Kathy Porada 3eme anneacuteeA manycore processor to automatically parallelize a run and a deterministic parallel program-ming modelEncadrement B Goossens G Sassatelliseptembre 2014 rarrmdash Financement par creacutedits europeacuteens (36 mois)

mdash Hugues de Lassus Saint-Geniegraves 3eme anneacuteeGeacuteneacuteration de codes hautes performances sous contraintes architecturales appliqueacutee aux fonctionsmatheacutematiquesEncadrement D Defour G Revyoctobre 2014 rarrmdash Financement par creacutedits ANR (36 mois)

HDR soutenues

mdash David Defour Soutenance en octobre 2014Contribution au calcul sur GPU consideacuterations arithmeacutetiques et architecturales

mdash Christophe Negre Soutenance en juin 2016Multiplication in finite fields and elliptic curves

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 22: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

Projets 2013ndash2016

Valorisation

Actility (2013-2014) Montant 14000 e Convention UPVD DRV (451REC03)

3E (2015-2016) Montant 14000 e Convention UPVD DRV (451REC04)

EDF RampD (2016-2017) Montant 19400 e Convention CNRS DR LR (EDF-LIRMM CT133129)

Collaboration

ANR INS DEFIS (2011-2015) http defislip6frPartenaires IRISALannion LIP6UPMC Paris LIRMMPerpignan CEA LISTSaclay THALESPariset InpixalRennesDotation 994498 ePour des raisons de consommation drsquoeacutenergie de surface etou de coucirct de conception certainesarchitectures ne proposent pas de support mateacuteriel agrave lrsquoarithmeacutetique flottante Une alternativeconsiste alors agrave utiliser lrsquoarithmeacutetique virgule fixe ce qui rend le deacuteveloppement drsquoapplicationsnumeacuteriques coucircteux en temps Lrsquoobjectif du projet ANR DEFIS est de proposer un flot auto-matiseacute de geacuteneacuteration de codes en virgule fixe travaillant agrave partir drsquoune application existanteou de briques de base (eacutevaluation polynomiale multiplicationinversion de matrices ) Ceprojet a donneacute lieu au deacuteveloppement de nombreux outils qui ont eacuteteacute valideacutes en partie sur lesapplications industrielles de THALES et Inpixal

ANR INS MetaLibm (2014-2017) http wwwmetalibmorgANRMetaLibmPartenaires InriaINSA Lyon LIPENS Lyon LIP6UPMC Paris LIRMMPerpignan etCERNGenegraveveDotation 622782 eLe deacuteveloppement drsquoapplications numeacuteriques reposent tregraves souvent sur lrsquoutilisation de biblio-thegraveques matheacutematiques Lrsquoeacutecriture optimiseacutee de ces bibliothegraveques requiert de connaicirctre par-faitement lrsquoarchitecture sur laquelle elle est censeacute ecirctre utiliseacutee agrave savoir son jeu drsquoinstructionsses uniteacutes de calculs ses caracteacuteristiques arithmeacutetiques et de meacutemoire Lrsquoobjectif du projetANR MetaLibm est de proposer des outils automatiseacutes pour la geacuteneacuteration de codes flottantspour lrsquoeacutevaluation de fonctions matheacutematiques (fonctions logarithme exponentiel trigonomeacute-triques ) et de filtres optimiseacutes pour une architecture agrave caracteacuteristiques donneacutees (supportvectoriel etou scalaire arithmeacutetique binary3264 )

ANR PAVOIS (2012-2016) http pavoisirisafrPartenaires DALILIRMM IRISADotation 348868 e

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures
Page 23: DALI Digits,architecturesetlogicielsinformatiques 1 … · 2019. 5. 16. · tures matérielles actuelles, de leurs unités de calculs et des arithmétiques qu’elles supportent

LrsquoANR Pavois fait intervenir deux pocircles DALILIRMM et lrsquoIRISA (Lannion) Elle a pour butdrsquoameacuteliorer la seacutecuriteacute des implantations embarqueacutees Le pocircle DALILIRMM et plus particuliegrave-rement la thegravese de J-M Robert a pour but de proposer de nouvelles approches algorithmiquespour contrer ces attaques mateacuterielles le point de vue mateacuteriel eacutetant eacutetudieacute plus profondeacutement agraveLannion Nous avons exploreacute des approches reacuteguliegraveres parallegraveles et seacutequentielles proteacutegeant lesimplantations contre la Simple Power Analysis Nous avons aussi proposeacute des contre-mesurescontre la DPA baseacutees sur la randomisation des calculs

PEPS QUARENUM (2013) https wwwlrifr baboulinquarenumhtmlPartenaires LRI LIP6 LIPENS Lyon LIRMM EDF RampDDotation 5000 eLe projet QUARENUM (QUAlity and REproducibility in NUMerical applications on the roadto Exascale) vise agrave concevoir et impleacutementer des algorithmes efficaces pour la validation etla reproductibiliteacute numeacuteriques en calcul haute-performance (HPC) Ce projet srsquointeacuteresse plusparticuliegraverement aux meacutethodes drsquoanalyse de la sensibiliteacute des applications HPC aux erreurs(eg simulation de la propagation des erreur par arithmeacutetiques stochastique ou drsquointervallesestimation de nombre de conditionnement et drsquoerreur inverse) Ces aspects et lrsquoobjectif dereproductibiliteacute numeacuterique sont eacutetudieacute dans le contexte drsquoarchitectures massivement parallegraveleset heacuteteacuterogegravenesCe PEPS a permis la preacuteparation des projets REQUIN et GRAAF soumis agrave lrsquoANR en 20142015 et 2016 mais non retenus

161 rue Ada bull F - 34392Montpellier Cedex 05 bull Teacutel 33 (0) 4 67 41 85 85 bull Fax 33 (0) 4 67 41 85 00 bull wwwlirmmfr

  • Preacutesentation geacuteneacuterale
  • Evolution de leacutequipe
  • Organisation et vie de leacutequipe
  • Activiteacutes scientifiques
    • Action 1 autour du logiciel PerPI
    • Action 2 architectures multicœurs
    • Action 3 protocoles cryptographiques
    • Action 4 pour une meilleure qualiteacute numeacuterique des calculs
      • Faits marquants
        • Prix et distinctions
          • Rayonnement
            • Organisation drsquoeacuteveacutenements
            • Comiteacutes de programme et activiteacute eacuteditoriale
            • Invitation
              • Valorisation et transfert
                • Valorisations contractuelles
                • Expertises et transfert technologique
                  • Collaborations
                    • Projets collaboratifs
                    • Autres collaborations
                      • Production scientifique
                        • Cinq publications majeures
                        • HDR et thegraveses
                        • Logiciels
                          • Implication FormationRecherche
                          • Implication dans les structures