Mohamed Faouzi HARKAT, Gilles MOUROT et José Ragot...

Fault Detection using a Robust Principal Component Analysis

Mohamed Faouzi HARKAT, Gilles MOUROT et José Ragot

Institut National Polytechnique de Lorraine (INPL)Centre de Recherche en Automatique de Nancy (CNRS)

2, avenue de la forêt de Haye, 54 516 Vandœuvre les Nancy, France

José RAGOT (CRAN) ACP 1 / 29

1 Rappel historique

2 Principes de l’Analyse en Composantes Principales

3 Influence des valeurs aberrantes et robustesse

4 Exemple numérique : mesures avec valeurs aberrantes

5 Application au diagnostic

6 Conclusion

1. L’ACP ?

L’ACP a été « inventée » en 1901 par Karl Pearson a. Actuellement,l’ACP est utilisée comme outil d’exploration et d’analyse dedonnées ainsi que pour la conception de modèles.

L’ACP est basée sur une transformation de l’espace dereprésentation des données, le nouvel espace étant de dimensioninférieure à celle de l’espace initial.

Selon les domaines d’application, l’ACP est aussi connue sous lenom de transformation de Karhunen-Loève, de transformation deHotelling ou encore de décomposition orthogonale.

L’ACP met en œuvre une décomposition en valeurs et vecteurspropres de la matrice de covariance des données ou encore unedécomposition en valeurs singulières de la matrice des données.

a. Pearson, K. (1901). On Lines and Planes of Closest Fit to Systems of Points in Space.Philosophical Magazine 2 (6) : 559-572. http ://stat.smmu.edu.cn/history/pearson1901.pdf.

Principes de l’Analyse enComposantes Principales

2. Principe de l’Analyse en Composantes Principales

On dispose d’une matrice de données X ∈RN×n, de vecteurs lignes xTi , qui

rassemble les N mesures effectuées sur les n variables du système. Critère deréduction de dimension :

φ(p) =N

∑i=1‖ xT

i −πxTi ‖2, π = ppT

Evaluer la matrice de covariance expérimentale des données :

S = XT

I− UUT

U, le vecteur de dimension N dont toutes les composantes sont égales à 1,permettant de centrer les données.Les directions pi , i = 1..n sont les vecteurs propres de Σ. Il convient donc derésoudre l’équation :

ΣP = PΛ

P ∈Rn.n étant la matrice des vecteurs propres pi de Σ et Λ ∈Rn.n celle,diagonale, de ses valeurs propres λi .On peut également montrer la décomposition suivante :

X = TPT

T = XPJosé RAGOT (CRAN) ACP 5 / 29

2. Principle de la réduction de dimension

Définition

X = TPT , T =(

t1 . . . tm)

∈RN×m : composantes principales

T = XP, P =(

p1 . . . pm)

∈Rm×m : vecteurs propres

Σ = PΛPT , Λ = diag(λ1 . . .λm) ∈Rm×m : valeurs propres

Décomposition de la matrice de variance-covariance

Λ(ℓ) 00 Λ(m−ℓ)

P(ℓ) | P(m−ℓ))

T (ℓ) | T (m−ℓ))

X = X̂ + X̃

X̂ = XC(ℓ) C(ℓ) = P(ℓ)P(ℓ)T

X̃ = XC(m−ℓ) C(m−ℓ) = Im−P(ℓ)P(ℓ)T

2. Reconstruction d’une variable

Reconstruction d’état

x1 . . . xr−1 xr xr+1 . . . xm

x̂r =(

x1 . . . xr−1 zr xr+1 . . . xm

cr ,1 . . . cr ,r−1 cr ,r cr ,r+1 . . . cr ,m)

zr =[cT−r 0 cT

1−crrx

Un formalisme plus général de reconstruction

x̂(ℓ)r = G(ℓ)

G(ℓ)r =

Ir−1 0 0r−1cT−r 0 cT

+r0r−1 0 Ir

Il est possible (sous condition) de reconstruire n’importe qu’elle composante de xen utilisant les (m−1) composantes restantes.

2. Sommaire des résultats de l’ACP pour le diagnostic

Projection des données dans le sous-espace résiduel

x̃ = (I−C(ℓ)) x

Reconstruction des données

x̂(ℓ)r = G(ℓ)

r x r = 1..n

Projection des reconstructions dans le sous-espace résiduel

x̃(ℓ)r = (I−C(ℓ))x̂(ℓ)

r = P(ℓ)r x r = 1..n

P(ℓ)r = I−C(ℓ)− (I−C(ℓ))ξr ξ T

r (I−C(ℓ))

1−ξ Tr C(ℓ)ξr

Détection de défauts

analyse de x̃ , x̂(ℓ)r et x̃(ℓ)

3. Influence des valeurs aberrantes

ACP sur des données sans valeuraberrantePente estimée : 1.502

−4 −2 0 2 4

ACP sur des données avec valeursaberrantesPente estimée : 1.834

−4 −2 0 2 4

3. ACP robuste aux valeurs aberrantes

ROBPCA : ACP robuste

0 0.5 1 1.5 2−0.5

Première idée : distributionscontaminées

p(ε) = µ N (0,σ21 )+(1−µ) N (0,σ2

Deuxième idée : matrice decovariance robuste

∑i=1

∑j=i+1

w(i , j)(x(i)−x(j))(•)T

∑i=1

∑j=i+1

w(i , j)

où les poids w(i , j) sont définis par :

w(i , j) = exp(

−β2‖ x(i)−x(j) ‖2Σ−1

3. Distribution contaminée

L’approche proposée repose sur la prise encompte de deux type d’erreurs dans les données.

Premier type : erreurs de faibles amplitudesprovenant de variations à caractère aléatoire ducomportement des capteurs. On les considèrecomme des réalisations de variables aléatoire dedistribution gaussienne.

Deuxième type d’erreur : relatif aux valeursaccidentelles, se manifestant sous forme dedonnées dites aberrantes ; elles peuvent être duesà des défauts passagers des capteurs. Ces valeursaberrantes, généralement de forte amplitude,peuvent aussi être considérées comme desréalisations de variables aléatoires de distributiongaussienne.

Les deux distributions seront caractérisées par desvariances différentes. De façon globale, pourreprésenter ces erreurs, on propose d’utiliser unedistribution dite contaminée correspondant aumélange, avec des poids µ et 1−µ , desdistributions des deux types d’erreur :

f1(ε) =1√

2πσ1exp

f2(ε) =1√

2πσ1exp

f (ε) = µ f1(ε)+(1−µ)f2(ε)

−10 −5 0 5 100

0.05σ

−10 −5 0 5 100

F IGURE: Distributioncontaminée (µ = 0.1)

−10 −5 0 5 100

0.05σ

−10 −5 0 5 100

F IGURE: Distributioncontaminée (µ = 0.5)

3. Estimation robuste : un exemple simple (moyenne et écrat-type)

0 10 20 30 40 50 600

Moyenne Ecart-typesans val.aberr. 0.964 0.279

avec val. aberr. standard 1.380 0.964avec val. aberr. robuste 0.970 0.274

3. ACP robuste

Rappel : projection des donnéest = Xu, t ∈R

L’erreur de reconstruction des données à partir de cet axe est :

X̃ = X(I−ppT ) (2)

HypothèseX̃ ∼ µN (0,σ2

1 I)+(1−µ)N (0,σ22 I) (3)

L’erreur de reconstruction relative à l’observation de rang k , définie à partir de (2) :

x̃(k) = (I−ppT )x(k) (4)

est considérée comme la réalisation d’une variable aléatoire de densité de probabilité :

f (x̃(k)) = µ f1(x̃(k))+(1−µ)f2(x̃(k))

f1(x̃(k)) =1

(2π)v2 σv

−‖ x̃(k) ‖22σ2

f2(x̃(k)) =1

(2π)v2 σv

−‖ x̃(k) ‖22σ2

3. ACP robuste

Afin d’estimer à partir des mesures la direction de projection p, on forme la fonction delog-vraisemblance de l’ensemble des erreurs de reconstruction, sous l’hypothèsed’indépendance statistique de ces erreurs :

∑k=1

log f (x̃(k))

La recherche du maximum de V vis-à-vis de p conduit à :

(XT W (p)X −λ I)p = 0

avec :

W (p) = diag(w(1) . . .w(N))

w(k) =

µf1(x̃(k))

+(1−µ)f2(x̃(k))

µ f1(x̃(k))+(1−µ)f2(x̃(k))

x̃(k) = (I−ppT )x(k)

3. ACP robuste

Comme la ondération W dépend implicitement de la direction p, la résolution est réalisée par uneprocédure itérative. Ainsi, une procédure dite à itération directe s’explicite, en fonction de l’indice id’itération, de la façon suivante :

E1 Initialisation i = 0,w (i)(k) = 0E2 i ← i +1 Solution à l’étape i

W (p(i)) = diag(w (i−1)(1) . . . w (i−1)(N))

(XT W (p(i))X −λ I)p(i) = 0

x̃(i)(k) = (I−p(i)p(i)T )x(k)

w (i)(k) =

µf (i)1 (x̃(i)(k))

+(1−µ)f (i)2 (x̃(i)(k))

µ f (i)1 (x̃(i)(k))+(1−µ)f (i)

2 (x̃(i)(k))

f (i)1 (x̃(i)(k)) =

(2π)v2 σv

−‖ x̃(i)(k) ‖22σ2

f (i)2 (x̃(i)(k)) =

(2π)v2 σv

−‖ x̃(i)(k) ‖22σ2

E3 test de convergence

3. ACP robuste

A chaque itération, le vecteur p retenu correspond au vecteur propre de la matriceXW (p(i))X associé à la plus grande valeur propre de cette matrice.

A la fin de cette procédure itérative, on dispose ainsi de la première composanteprincipale déterminée de façon robuste vis-à-vis des valeurs aberrantes.

Pour rechercher les directions principales suivantes, on propose d’utiliser laméthode classique de déflation qui consiste à soustraire progressivement de lamatrice X initiale les informations expliquées par la direction principale qui vientd’être trouvée.

Ainsi à l’étape ℓ, notons X (ℓ) la matrice X dont on a soustrait l’influence desdirections propres précédentes. On a alors la mise à jour suivante :

X (ℓ+1) = X (ℓ)−Xp(ℓ)p(ℓT )

Cette procédure de déflation est appliquée jusqu’à avoir extrait l’ensemble del’information utile de la matrice des données X .

Exemple numérique : mesuresavec valeurs aberrantes

4. Exemple

x∗1(k)∼N (0,1)x∗2(k) =−x∗1(k)x∗3(k) = x∗1(k)−x∗2(k)x∗4(k) = x∗1(k)−3x∗2(k)x∗5(k) = 0.5x∗2(k)+x∗3(k)x∗6(k) = x∗1(k)−4x∗2(k)x∗7(k) = 0.2x∗2(k)+x∗3(k)

Modèle vrai1 1 0 0 0 0 0

-1 1 1 0 0 0 01 -3 0 -1 0 0 00 0.5 1 0 -1 0 01 -4 0 0 0 -1 00 0.2 1 0 0 0 -1

Modèle vrai normalisé1 0 0 0 0 0 -0.5560 1 0 0 0 0 0.5560 0 1 0 0 0 -1.1110 0 0 1 0 0 -2.2220 0 0 0 1 0 -0.8330 0 0 0 0 1 -2.778

TABLE: Coefficients du modèle ayant généré les données

4. Exemple

• A chaque variable ainsi générée à été superposé un bruit issu de la réalisation d’unevariable aléatoire à densité gaussienne :

xi (k) = x∗i (k)+bi (k), bi (k)∼N (0,σ)

• De plus, des valeurs aberrantes (chacune d’amplitude arbitrairement égale à 2) ontété ajoutées à différentes variables (table 2 où la première ligne indique les variablescorrompues, la deuxième ligne indiquant les instants où les valeurs aberrantes ont étéappliquées).

x1 x2 x3 x4 x5 x6 x7k 2, 10 3, 4 6 10, 19, 28 19 28 37

TABLE: Liste des variables corrompues par des valeurs aberrantes

4. Exemple

0 5 10 15 20 25 30 35 400

F IGURE: Poids estimés

5 10 15 20 25 30 35 40

5 10 15 20 25 30 35 40−5

5 10 15 20 25 30 35 40−2

5 10 15 20 25 30 35 40−6

F IGURE: Projection des données

4. Exemple

Modèle vrai normalisé

x1−0.56 x7 = 0x2 +0.56 x7 = 0x3−1.11 x7 = 0x4−2.22 x7 = 0x5−0.83 x7 = 0x6−2.78 x7 = 0

Modèle estimé de façon non robuste

x1−0.61 x7 = 0x2 +0.49 x7 = 0x3−0.98 x7 = 0x4−2.89 x7 = 0x5−1.04 x7 = 0x6−3.19 x7 = 0

Modèle estimé de façon robuste

x1−0.57 x7 = 0x2 +0.53 x7 = 0x3−1.11 x7 = 0x4−2.23 x7 = 0x5−0.83 x7 = 0x6−2.76 x7 = 0

Application au diagnostic

5. Application au diagnostic

u1 y1,1 y1,2 e1u2 y2,1 y2,2 e2. . .

uN yN ,1 yN ,2 eN

ui = v2i +1+sin(0.1i), vi ∼ N (0,1)

ei ∼ N (0,1)

yi ,1 = aui a = 1

yi ,2 = bui b =−2

0 50 100 150 200-10

20Variable 1

0 50 100 150 200-10

20Variable 2

0 50 100 150 200-10

10Variable 3

0 50 100 150 200-5

5Variable 4

δu δy1 δy2r11 0 0 0r12 0 X Xr13 0 X Xr14 0 X Xr21 X 0 Xr22 0 0 0r23 X 0 Xr24 X 0 Xr31 X X 0r12 X X 0r33 0 0 0r34 X X 0r41 X X Xr42 X X Xr43 X X Xr44 0 0 0

TABLE: Faults signature

Résidus r1i obtenus en : reconstruisant les variablessans utiliser la variable 1 (u), calculant les résidus,puis en projetant les résidus dans l’espace résiduel

Résidus r2i obtenus en : reconstruisant les variablessans utiliser la variable 2 (y1), calculant les résidus,puis en projetant les résidus dans l’espace résiduel

Résidus r3i obtenus en : reconstruisant les variablessans utiliser la variable 3 (y2), calculant les résidus,puis en projetant les résidus dans l’espace résiduel

Résidus r4i obtenus en : reconstruisant les variablessans utiliser la variable 4 (e), calculant les résidus,puis en projetant les résidus dans l’espace résiduel

0 50 100 150 200-1

0 50 100 150 200-5

0 50 100 150 200-2

0 50 100 150 200-0.2

0 50 100 150 2000

F IGURE: ACP robuste. Projection deserreurs de reconstruction sans utiliser lavariable 1

0 20 40 60 80 100-1

0 20 40 60 80 100-2

0 20 40 60 80 100-0.5

0 20 40 60 80 1000

F IGURE: ACP ordinaire. Projection deserreurs de reconstruction sans utiliser lavariable 1

0 50 100 150 200-5

0 50 100 150 200-1

0 50 100 150 200-2

0 50 100 150 200-0.2

0 50 100 150 2000

0 20 40 60 80 100-0.5

0 20 40 60 80 100-1

0 20 40 60 80 100-2

0 20 40 60 80 1000

0 50 100 150 200-2

0 50 100 150 200-1

0 50 100 150 200-0.01

0 50 100 150 2000

0 20 40 60 80 100-1

0 20 40 60 80 100-5

0 20 40 60 80 100-1

0 20 40 60 80 100-5

0 20 40 60 80 1000

Conclusion

6. Pour conclure

Perspectives de développement de l’ACP

Robustesse vis-à-vis de dérives

Systèmes dynamiques

Systèmes non linéaires

Liens avec d’autres techniques : sous-espaces

Mohamed Faouzi HARKAT, Gilles MOUROT et José Ragot...

Documents

RAGOT RICHARDASSUIED ANNE-MARIE CP - Mon Specimen · 2018-05-22 · Texte à lire par l’enseignant . Le caillou magique . Unité 1 . C’est la rentrée (1) Ce matin, Mira et Sacha

Revue de l’OFCEIntroduction par Jérôme Creel et Xavier Ragot Les demandes de facteurs de production en France Bruno Ducoudré et Mathieu Plane La crise de 2008 et la productivité

Département : 91 Référence : IA91000667 Aire d'étude ... · complète" sous la dir. de Maurice Culot, David Peycéré et Gilles Ragot. Paris, Institut français d'architecture,

Phare SQPx- 2016-02 - Ville de Saint-Quay-Portrieux€¦ · Pascale Ragot se propose bénévolement de vous aider. Permanence chaque mercredi, de 9h à 11h, (hors vacances scolaires)

Nathalie RAGOT (IE + CA46) · LES SYSTEMES DE PRODUCTION DE CHEVAUX DE TRAIT DU RESEAU EQUIN: fonctionnement et résultats technico-économiques ... RESULTATS ECONOMIQUES DE L’ATELIER

ÉROSION DU TISSU PRODUCTIF EN FRANCE · 2015-09-28 · 100 Michel Aglietta et Xavier Ragot de plus de 20 % entre 2007 et 2012. Ce processus de désendette-ment (deleveraging) est

Dossier sponsoring Venez vivre cette aventure avec nous ! Jérémy Garcia Julien Ragot EQUIPAGE N° 599

2016 - Demarche clinique et prise en soin ide palliatif › v2 › wp-content › uploads › 2015 › 10 › 2016-Dema… · en Soins Palliatifs et Fin de vie Brigitte Ragot, IDE/UMSP

Conseiller éditorial : Lionel Ragot - PCA CMB

Prise en charge des symptômes inconfortables en Soins Palliatifs et Fin ...€¦ · Démarche clinique et prise en soin IDE en Soins Palliatifs et Fin de vie Brigitte Ragot, IDE/UMSP

Master « Sciences et Techniques des Activités … MOUROT... · I.1.2 Analyse biomécanique du smash : L’épaule joue un rôle prépondérant dans le smash, comme dans tous les

CAP Petite Enfance - Unitheque.com€¦ · CAP Petite Enfance et ASSMAT Entraînement à l’Épreuve EP1 Annick DUCOMMUN Christophe RAGOT Christèle RATÉRO Feuillets détachables

Détection et isolation de défauts par analyse en …w3.cran.univ-lorraine.fr/perso/jose.ragot/2009_JDMACS...2. Quelques références du laboratoire sur ACP et diagnostic 1 Harkat

Détection du surentraînement Intérêt de l’étude du ......UE 6B Licence Entraînement Sportif Prévention et traumatologie du sportif L. Mourot La fatigue musculaire / le surentraînement

Étude surla( «(RadedeBREST(» · Egalement,’ le professeur François Arnal,’ la géographe Françoise Perron,’ Alain Daoulas et Didier Ragot, JeanR ... R Brest!Terres!Océanes!(M.!Costil)!

Dépliant Presse 'Cadeaux des Tsars' · Cadeaux des Tsars Adultes et jeunes dimanche 30 mai 2010 à 14h30 par Marjolaine Mourot, commissaire de l'exposition tarif plein: 9euros, tarif

Diagnostic et Surveillance de Systèmes. Méthodes et ...w3.cran.univ-lorraine.fr/perso/jose.ragot/CONF_diag.pdf1. Généralités : les étapes du diagnostic • Surveillance - centralisation

Conception d’un capteur logiciel pour la dé ...w3.cran.univ-lorraine.fr/perso/benoit.marx/2010_C2I_TRINH.pdf · {Do-Hieu.Trinh,Benoît.Marx,Jose.Ragot}@ensem.inpl-nancy.fr ** EDYC-CC

Antenne cadre ou magnétique 20 / 40 / 80 M - on4mns.be · Antenne cadre ou magnétique 20 / 40 / 80 M par F6BCU F6GFN Bernard Mourot F6BCU REMOMEIX , Fevrier 2002 pour AMAT-RADIO

Dans le sens de la vie Productions · Dans le sens de la vie Productions présente Le Maître est l’enfant un film d’Alexandre Mourot Durée : 1h30 SORTIE DU FILM EN SALLE : 27