14
IMPLANTATION D’UN PRODUIT DE MATRICES TOLÉRANT AUX FAUTES Caçote Mikael et Abou Haydar Georges

Implantation d’un produit de matrices tolérant aux fautes

  • Upload
    moira

  • View
    53

  • Download
    5

Embed Size (px)

DESCRIPTION

Implantation d’un produit de matrices tolérant aux fautes. Caçote Mikael et Abou Haydar Georges. Introduction. L’effet des rayons cosmiques sur le noyau de silicium Tolérance aux pannes Compensation (error masking) TMR Triple Modular Redundancy - PowerPoint PPT Presentation

Citation preview

Page 1: Implantation d’un  produit  de matrices  tolérant  aux  fautes

IMPLANTATION D’UN PRODUIT DE MATRICES TOLÉRANT AUX FAUTES

Caçote Mikael et

Abou Haydar Georges

Page 2: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Introduction

1. L’effet des rayons cosmiques sur le noyau de silicium

2. Tolérance aux pannes1. Compensation (error masking)

1. TMR Triple Modular Redundancy

2. Recouvrement (error recovery)1. Par reprise : Checkpointing2. Par poursuite : Algorithm-Based Fault Tolerance

(ABFT)

Page 3: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Encodage Des Matrices

Encodage à un plus haut niveau Row Checksum Matrix Column Checksum Matrix Full Checksum Matrix A

CHECKSUM

CHECKSUM C

Page 4: Implantation d’un  produit  de matrices  tolérant  aux  fautes

A

CHECKSUM

B

CHECKSUM

C

CHECKSUM

CHECKSUM C

Multiplication

Page 5: Implantation d’un  produit  de matrices  tolérant  aux  fautes

L

CHECKSUM

U

CHECKSUM

C

CHECKSUM

CHECKSUMC

Décomposition LU

Page 6: Implantation d’un  produit  de matrices  tolérant  aux  fautes

A

CHECKSUM

B

CHECKSUM

C

CHECKSUM

CHECKSUM CCHECKSUM C

CHECKSUM

C

Addition

Page 7: Implantation d’un  produit  de matrices  tolérant  aux  fautes

C

CHECKSUM

Ct

CHECKSUM

CHECKSUM CCHECKSUM C

Transposée

Transposition

Page 8: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Extensions Vs Opérations

Les extensions n’affectent pas les 5 opérations que nous effectuons sur les matrices

Page 9: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Conception

Contrats Choix du Langage : Java ou C++ Types Génériques Structures de données : arbres des

différents types de matrices

Page 10: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Processeurs et Calculs

Implémentation avec différentes bibliothèques Atlas GotoBlas IntelMkl

Design Pattern : Strategy

Page 11: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Générations d’erreurs

Injection d’un nombre d’erreur bien défini dans le calcul

Thread en parallèle qui génère des erreurs

Page 12: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Detection/Correction

Detection : Checksum calculé différent du checksum stocké dans la Full Checksum Matrix correspondante

Correction : Résolution système Equations = lignes ou colonnes contenant les

erreurs

Correction sûre pour une erreur mais pas pour plus d’erreurs

Page 13: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Benchmarks

A venir

Page 14: Implantation d’un  produit  de matrices  tolérant  aux  fautes

Travaux en cours

Résoudre le problème d’arrondi (roundoff errors)

Remplacer les calculs des checksums par des calculs plus évolués permettant de corriger plus d’erreurs