15
Multivariate Curve Resolution (MCR) Chimiométrie [LCHM1320]

Multivariate Curve Resolution (MCR)

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Multivariate Curve Resolution (MCR)

Multivariate Curve Resolution (MCR)

Chimiométrie [LCHM1320]

Page 2: Multivariate Curve Resolution (MCR)

Introduction▶ Défini&on : ▷ Résolu'on Mul'variée de Courbes pour résoudre le « mixture analysis problem » ▷ via un modèle addi3f bilinéaire de contribu3ons pures

▶ But principal exploratoire : visualiser et interpréter les données

▶ Ini&alement développé pour des données analy&ques évolu&ves▷ Dont les deux direc'ons ont une interpréta'on claire▷ Modèle analy'que sous-jacent en spectroscopie : loi de Beer-Lambert = modèle bilinéaire

de concentra'ons de signaux purs

▶ Applica&ons principales en chimie :▷ Profils de concentra.on de composés purs dans un mélange ▷ Suivi temporel de réac.ons chimiques (eg. plusieurs batchs d’une réac.on)▷ Données d’imagerie hyperspectrales, …

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 2

Page 3: Multivariate Curve Resolution (MCR)

Exemple d’application sur des données chimiques▶ Jeu de données “2-voies” avec résolu&on temporelle

Matrice X

2020-2021 © M. Martin UCLouvain - LCHM1320 – Chimiométrie - MCR 3

Page 4: Multivariate Curve Resolution (MCR)

Exemple d’application sur des données chimiques

MCR

Spectres de mélange

Spectres des espèces pures

Profil de concentra8on des espèces pures

Données “naturellement” bilinéaires

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 4

Page 5: Multivariate Curve Resolution (MCR)

Modèle additif bilinéaire▶ Un exemple bien connu : la Loi de Lambert-Beer

▶ Dans l’exemple, 2 espèces pures (A et B)

• Composé par composé

C matrice des concentra.ons puresS matrice des spectres purs

Modèle bilinéaire

X = CS! + E

• Sous forme matricielle

X XBXA XBXA

X

X

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 5

Page 6: Multivariate Curve Resolution (MCR)

Multivariate Curve Resolution – Alternating Least Squares

▶ Es&ma&on itéra&ve▷ Op'misa'on de C et S en alternance à par'r d’es'mateurs ini'aux

▶ Permet d’inclure de l’informa&on extérieure a priori▷ Connaissances chimiques/mathéma'ques peuvent être introduites dans le modèle

▶ Différentes étapes :1) Choix du nombre de composantes extraites

2) Es'ma'ons ini'ales de C ou S

3) Choix des contraintes

4) Algorithme ALS

5) Vérifica'on de la qualité du modèle

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 6

Page 7: Multivariate Curve Resolution (MCR)

MCR-ALS (1)1) Choix du nombre de composantes extraites▷ = nombre d’espèces pures du système▷ Généralement, sur base d’un scree plot d’une PCA▷ Le nombre d’espèces pures, si connu d’avance▷ !Important de bien le choisir

2) Es&ma&ons ini&ales de C ou S▷ Evolving Factor Analysis (EFA)

§ Si direc.on structurée des données avec évolu.on con.nue et séquen.elle

§ e.g. évolu.on temporelle

▷ Méthodes de sélec'on de variables les plus pures§ SIMPLISMA, OPA, …§ But : trouver des lignes/colonnes de X les plus pures (i.e. dissimilaires) comme es.mateurs ini.aux§ Ils doivent idéalement être les plus proches des profils finaux

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 7

Page 8: Multivariate Curve Resolution (MCR)

MCR-ALS (2)3) Contraintes▷ Permet d’introduire de l’information chimique/mathématique dans le modèle▷ Dépendent du jeu de données▷ Exemple :

§ Non-négativité: force les profils à être positifs (eg: concentrations)§ Unimodalité: un seul maximum par profil autorisé (eg: profils d’élution)§ …

4) Algorithme ALS▷ Régressions alternées sous contraintes jusqu’à atteindre le critère de convergence

5) Vérification de la qualité du modèle▷ Lack of Fit, R2, …

𝐶 = 𝑋𝑆 𝑆!𝑆 "# 𝑆′ = 𝐶!𝐶 "#𝐶!𝑋 Critère: min 𝑋 − 𝐶𝑆!

𝑅$ = 100 ∗ 1 −𝐸

$

𝑋$ avec 𝐸 = 𝑋 − 𝐶𝑆!

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 8

Page 9: Multivariate Curve Resolution (MCR)

MCR-ALS (3)Incer&tudes dans la solu&on

▶ Différents types :▷ Les composantes extraites ne sont pas ordonnées (>< PCA)▷ Ambiguité des intensités: unités arbitraires pour C et S▷ Ambiguité rota'onnelle: différentes combinaisons de profils de C et S s’ajustent de façon

équivalente aux données

▶ Les contraintes permeUent de réduire ces ambiguités

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 9

Page 10: Multivariate Curve Resolution (MCR)

Analyse de plusieurs tableaux de données▶ Structure bilinéaire conservée

▶ Matrices “augmentées” ou mul3sets: ▷ Par ligne : eg: monitoring mul.technique d’un processus

▷ Par colonne: eg: monitoring de plusieurs runs

▷ Par ligne et par colonne

▶ Les matrices doivent :▷ avoir de l’informa.on en commun▷ avoir un mode commun (C ou S) (eg: profils spectraux)

Exemple d’un jeu de données “3-way”: Plusieurs runs HPLC-DAD

𝑋! 𝑋" 𝑋# …𝑋$ = 𝐶 𝑆!% 𝑆"% 𝑆#% … 𝑆$% + 𝐸! 𝐸" 𝐸# …𝐸$ = 𝐶𝑆&'(% +𝐸&'(

𝑋#𝑋$𝑋%…𝑋&

=

𝑋#𝑋$𝑋%…𝑋&

S! +

𝑋#𝑋$𝑋%…𝑋&

= 𝐶'()𝑆! + 𝐸'()

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 10

Page 11: Multivariate Curve Resolution (MCR)

Comparaison avec la PCA▶ Comme la PCA, méthode non supervisée

▶MCR : développé pour données analy&ques évolu&ves

▶ Construc&on des composantes :PCA: imbriquées vs MCR: non imbriquées

▶ Par construc+on, la PCA a des composantes orthogonales 2 à 2Mais les spectres de composés purs ne sont jamais totalement orthogonaux

=> plus difficile d’interpréter ces CPs en lien avec les spectres purs

▶ D’autres contraintes peuvent être appliquées directement en MCR

▶ En MCR, les profils (spectraux et de concentra+on) extraits par MCR-ALS ont un sens chimique direct

X = CS2 + E

X = TP2 + EPCA :

MCR :

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 11

Page 12: Multivariate Curve Resolution (MCR)

PCA vs MCR▶ PCA

1

23

4

Condi&ons

1

23

4

Condi&ons

▶MCR

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 12

Page 13: Multivariate Curve Resolution (MCR)

Non-negative Matrix Factorization (NMF)▶ Objec+f▷ Décomposer une matrice non-néga've X en une matrice S contenant r vecteurs de base

non-néga'fs et une matrice C contenant des coefficients non-néga'fs.

▶Modèle et critère d’op+misa+on (iden+ques à la MCR)

▶ Contraintes▷ Non-néga'vité de tous les éléments de C et S ▷ Des contraintes supplémentaires peuvent également être incluses dans des modèles plus

avancés

▶ Algorithme d’op+misa+on▷ Descente de gradient

Modèle ∶ X = CS! + E Critère : min 𝑋 − 𝐶𝑆! "

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 13

Page 14: Multivariate Curve Resolution (MCR)

Résumé avantages / inconvénients de la MCR▶ Avantages principaux :▷ On ne doit pas connaitre a priori le système physico-chimique étudié▷ Si de l’informa'on a priori est disponible, elle peut être intégrée à la MCR▷ Flexibilité d’applica'on

▷ Interpréta'on directe des profils extraits

▶ Limita+ons principales : ▷ la dyade des profils Concentra'ons-Spectres doit être différente pour chaque composé

§ problème si deux composés ont :• des concentra+ons directement propor+onnelles entre eux• des spectres purs iden+ques

▷ Ambiguité possible des solu'ons

▷ Les résultats sont influencés par les paramètres et les choix de valeurs ini'ales

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 14

Page 15: Multivariate Curve Resolution (MCR)

Références utiles▶ De Juan, A., Jaumot, J., & Tauler, R. (2014). Mul.variate Curve Resolu.on (MCR). Solving the mixture

analysis problem. Analy&cal Methods, 6(14), 4964-4976.

▶ CheMoocs 2020 (Agreenium): Chimiometrie chapitre 1/2 : les méthodes non supervisées (hfps://www.fun-mooc.fr/courses/course-v1:Agreenium+66002+session05/info)

2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 15