Etalonnage et modélisation

Etalonnage

11ème MIEC - 21ème JIRECMultimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie

1er, 2 et 3 Juin 2005 à Autrans

Etalonnage

sig

na

l

ImpuretésProduits de dégradation

Standards de calibration: Fonction réponse

Contrôle qualité: Linéarité, Répétabilité, fidélité intermédiaire, exactitude

domaine

OBJECTIFS

Déterminer une procédure d’étalonnage inverse adapté.

1a. Intervalle de dosage1b. Fonction réponse2. Evaluation des limites de

détection et de quantification3. Prédire une incertitude de

mesure à l’aide de QC (exactitude et précision)

Simulation du travail de routine à l'aide d'échantillons de concentrations connues.

Etalonnage/modélisation en sciences analytiques

Etalonnage

Réponse analytique

Teneur

LOQ

Gamme linéaire

Gamme dynamique

LOD

Détermination de la borne supérieure du domaine linéaire

Permission J. Vial – Paris

Estimation LOD/LOQ

Domaine d’analyses

Etalonnage

Modéliser : utiliser des données expérimentales pour prévoir une

information quantitative inconnue Y à partir de mesures de X via une

certaine « fonction mathématique » :

Le modèle mathématique postulé peut être :

Sinon un polynôme de

degré convenable.

Ajustement polynomialY

X

Modèle Y = f(X) avec un

polynôme de degré convenable

Une droite si Y varie

linéairement avec X.

Ajustement linéaireY

X Y= b1X + b0Modèle

Modélisation

Etalonnage

Dans le cas les plus simple il existe une

relation linéaire entre :

et une seule grandeur physique Y

généralement donnée par un

appareil.

la grandeur à quantifier X

(ici la teneur de l’échantillon en un

composant donné)

Y = b1X + b0

Etalonnage/Relation linéaire

Etalonnage

Conclusion : les deux variables X et Y ne jouent pas le même rôle.

Quand on trace la courbe d’étalonnage d’une méthode d’analyse à partir d’étalons choisis par l’expérimentateur,

En revanche, la réponse Y obtenue est une variable aléatoire dans la mesure où elle dépend non seulement de X,

la concentration X de l’analyte n’est pas considérée comme variable aléatoire puisqu’elle est connue avec précision.

mais aussi de l’aléa de l’erreur expérimentale.

Régression

Etalonnage

On peut disposer de n couples [xi,yi] pour deux variables X et Y que l’on

suppose liées : à chaque valeur de X est associée une valeur de Y avec la relation :

(Y = ß1X + ß0)

Y représente le résultat observé,

X représente une teneur connue en analyte

Mais, expérimentalement, à chaque valeur xi de X, on obtient une valeur

yi entachée de l’erreur expérimentale εi. On a en réalité :

yi = ß1xi + ß0 + εi

Régression linéaire

Etalonnage

Y représente le résultat observé,

X représente une teneur connue en analyte

la relation linéaire postulée devient : Y = b1X + b0

Avec uniquement une « estimation » des coefficients a et b du modèle postulé.

Y = ß1X + ß0

Ces données sont toujours en nombre limité,

elles ne représentent donc qu’un échantillon de la population de toutes les mesures de la teneur en analyte de l’étalon que l’on pourrait effectuer.

Analyse Quantitative et Etalonnage

Etalonnage

A cause de cette erreur εi associée à chaque couple [xi,yi], si on

représente graphiquement yi en fonction de xi,

mais un «nuage» de points plus ou moins écartés de cette droite idéale.

on ne va pas obtenir des points “idéalement alignés”,


Etalonnage

Avec une seule variable X le modèle s ’écrit :

Y

X1 X2 X3 X4 X5

Y1

Y2

Y3

Y4

Y5

X

Y= 0 + 1 X + r

Modèle linéaire

Etalonnage

Y

X1 X2 X3 X4 X5

Y1

Y2

Y3

Y4

Y5

X

r1

r2

r3

r4

r5

Y1

^

Avec une seule variable X le modèle s ’écrit : Y= 0 + 1 X + r

On mesure la somme des carrés des écarts ri

(écarts appelés "résidus") entre la valeur vraie et la valeur

estimée ŷn sur la

courbe.

Faire un ajustement c'est minimiser la "distance" S = [Yi -f( Xi)]2 = r i

2

Ajustement linéaire

Etalonnage

Pour minimiser S,

il suffit d'annuler les

dérivées partielles

de S par rapport à

0 et à 1 :

S/0 = S/1 = 0.

La somme S des carrés des écarts entre les valeurs expérimentales et les valeurs calculées par le modèle s’écrit :

S = Σ [yi - (0 + 1xi )]2 est une fonction de 0 et 1.

Droite des moindres carrés et efficacité d’un ajustement

Etalonnage

Soit un jeu de calibration dans la gamme de 0 à 6 nanomoles

(les unités de fluorescence mesurées sont exprimées dans une échelle arbitraire dépendante de la gamme de concentration).

N° desessais

Conc. Xen nM

Unités deFluoresc. Y

1234567

0123456

0,13,8

10,014,420,726,929,1

Régression linéaire exemple : Fluorescence

Etalonnage

La droite des moindres carrés correspondant aux données a donc pour équation :

Y = 5,139 X – 0,418

Droite d’étalonnage

0

10

20

30

0 1 2 3 4 5 6 7

nMUn

ité

de

flu

ore

scen

ce

Régression linéaire exemple : Fluorescence

Etalonnage

Dans ce système les i sont les inconnues que nous devons estimer :

(bi est l ’estimation calculée de i ).

1. Au sens des moindres carrés (résolution algébrique) :

(yi - y)(xi - x) 1 = b1 =^

(xi - x)2 0 = b0 = y - b1 Xet ^

2. Au sens des moindres carrés (résolution matricielle) :

Estimation des coefficients

Etalonnage

Avec Excel:

1. Fonction graphique : courbe de tendance

2. Fonctions algébriques (pente, ordonnee.origine)

3. Fonction matricielle : Droitereg

Y = 5,139 X – 0,418


Etalonnage

Quelle confiance peut-on avoir :

d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)

d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)

Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?

Ŷi = b1Xi + b0

Analyse de la régression linéaire

Etalonnage

Y-

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

SCERVariation résiduelle

(yi - yi)2^

+Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Analyse globale : Analyse de variance

Etalonnage

Base de l’analyse de variance

Toute dispersion d’une série de données étant exprimée par la somme des carrés des écarts à la moyenne, on démontre la relation suivante sur laquelle est basée l’analyse de variance :

SCET = SCEL + SCER

Variation totale

(yi - y)2

Variation résiduelle

(yi - yi)2^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

Analyse globale : Analyse de variance

Etalonnage

Régression

Sources de variation

Sommes desCarrés des Ecarts

Degrés de lib.

Carrés moyens

Résidus

Total

2-1=1

7-2=5

7-1=6

SCEL = 739,56 739,56

SCER = 6,175 1,235

SCET = 745,72

Y-Y-Y-

(yi - y)2

Variation totale

SCET

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

r1

r2r3

r4

r5


(yi - yi)2^

+ SCERVariation résiduelle

(yi - yi)2^


(yi - yi)2^


(yi - y)2 = (yi - y)2^ ^ ^

SCEL=Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCELVariation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Fluorescence : Analyse de la variance

Etalonnage

Pour savoir si les variances des deux échantillons sont identiques ou différentes, il faut effectuer un test de comparaison de variances.

Loi de Fisher (dite aussi de Fisher-Snedecor)

Si deux échantillons de tailles n1 et n2 proviennent de lois normales de même variance,

le rapport F des variances estimées suit une loi de Fisher avec ν1 = n1 – 1 et ν2 = n2 – 1 qui sont les degrés de liberté pour chacun des échantillons

s12

s22 = F (1

2 , 22)

Test de comparaison des variances

Etalonnage

Les distributions de la loi F sont caractérisées par une dissymétrie gauche.

f(F)

FCourbe pour 1 et 2 donnés 0

f(F)

FCourbe pour 1 et 2 donnés

f(F)

FCourbe pour 1 et 2 donnés 0

Fcalculé =Variance s2

1

Variance s22

estimée avec ν1 degrés de liberté

estimée avec ν2 degrés de liberté

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

Exemple pour1 = 5 et 2 = 5

Fi

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6


0,08

0,06

0,04

0,02

00 1 2 3 4 5 6


0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6

0,08

0,06

0,04

0,02

00 1 2 3 4 5 6


Fi

On détermine la probabilité pour qu’une valeur de F soit inférieure à la valeur Fi portée en abscisse

S21 > S2

2 la plus grande variance au numérateur

Test de comparaison des variances

Etalonnage

Régression

Sources de variation

Sommes desCarrés des Ecarts

Degrés de lib.

Carrés moyens

Résidus

Total

2-1=1

7-2=5

7-1=6

SCEL = 739,56 739,56

SCER = 6,175 1,235

SCET = 745,72

Fcalc

598,8

F 1;5;0,05 = 6,608

Signif.

2,12.10-6

Y-Y-Y-

(yi - y)2

Variation totale

SCET

(yi - y)2

Variation totale

SCET

r1

r2r3

r4

r5

r1

r2r3

r4

r5


(yi - yi)2^

+ SCERVariation résiduelle

(yi - yi)2^


(yi - yi)2^


(yi - y)2 = (yi - y)2^ ^ ^

SCEL=Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCELVariation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison

(yi - y)2 = (yi - y)2^ ^ ^

SCEL=

Fluorescence : Analyse de la variance

Etalonnage

La mesure de l'efficacité de l'ajustement peut être exprimée par un coefficient appelé “coefficient de détermination” ou “coefficient de régression multiple”.

Si le modèle expliquait “idéalement” les résultats expérimentaux,

nous aurions SCET = SCEL

ou sous une autre forme SCEL/SCET =1

Pour un modèle parfait : SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).

SCET = SCEL + SCER

Analyse globale : coefficients de régression

Etalonnage

R2 = SCEL / SCET

R2 = 1 -SCER

SCET

R2 = (SCET–SCER)/ SCET

SCEL=SCET – SCER

R2 est la part de la dispersion expliquée par le modèle.

Pour un modèle parfait, R2 = 1 car SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).

Coefficient de détermination R²

Etalonnage

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

0 2 4 6 8 10 12 14

R2 = 0.820

0

0.5

1

1.5

2

2.5

3

0 2 4 6 8 10 12 14

R2 = 0.820

R2 = 0.820 R2 = 0.820

R2 = 0.820

Fonction réponse : R²

Etalonnage

Pour tenir compte du nombre d'essais, c'est à dire du nombre de degrés de liberté,

il existe un coefficient de régression "ajusté"

symbolisé par R2a et défini par :

Le rapport R2 n’est pas une garantie de la qualité d’un modèle (dépendance du nombre d’essais et du modèle choisi)

Ex. Avec deux points, droite; R2 = 1Avec trois points , droite; R2 < 1 mais 2ème degré R2 = 1

SCER /(n-p)

SCET /(n-1)R2a = 1-

Coefficient de détermination ajusté R²a

Etalonnage

R2 = 1 – (6,175/745,72) = 0,9917

R2a = 1 – ((6,175/5)/(745,72/6) = 0,9900

R2 = 1 -SCER

SCET

R2 = 1 -SCER

SCET

R2 = 1 -SCER

SCET

SCER /(n-p)

SCET /(n-1)R2a = 1-

SCER /(n-p)

SCET /(n-1)R2a = 1-

Fluorescence : coefficients de régression

Etalonnage

Résidus = écarts entre les points expérimentaux et la droite de régression

0

50000

100000

150000

200000

Y

0 0,5 1 1,5 2

X

-1500-1000-500

0500

10001500

Res

idua

l

0 0,5 1 1,5 2

X

Les résidus devraient suivre une loi normale centrée sur 0.

Un examen visuel permet généralement de déceler un problème de modèle (homoscédasiticité, courbure, ordre supérieur, etc.).

Analyse globale : examen des résidus

Etalonnage

Une courbe en cloche asymptotique à l’axe des x, dont le

maximum est pour x = x ,

Le graphe de la Loi Normale est caractérisé par :

Une symétrie par rapport à l’axe x = x,

Deux points d’inflexion à une distance de x égale à σ.

Moyenne

n

ii 1

1x x

n

n

22i

i 1

1ˆ x x

n 1

Variance

x x,

2

2

2

2

f x

f x

IC x

ICx

Propriétés de la loi Normale

Etalonnage

Probabilité = 68,27% pour que x soit compris dans l’intervallex 1

0,6827 0,9545


0,9973


Propriétés de la loi Normale

Etalonnage

99,73 %

En moyenne, l’erreur est nulle :

Distribution de Gauss centrée sur zéro(échelle des abscisses en unités d’écart-type)

95,45 %

La dispersion de « ri" est mesurée par sa variance : var(ri) = 2

68,27 %

o

-3 -2 -1 1 2 3

l’espérance mathématique E(ri) =0.

ou par l’écart-type .

s

Caractéristiques de l’erreur expérimentale ri

Etalonnage

Concentration Graphique des résidus

-1.5

-1

-0.5

0

0.5

1

1.5

2

0 1 2 3 4 5 6 7

Concentration

Rés

idu

s

ANALYSE DES RÉSIDUS

ObservationPrévisions

Signal Résidus1 -0.41785714 0.517857142 4.72142857 -0.921428573 9.86071429 0.139285714 15 -0.65 20.1392857 0.560714296 25.2785714 1.621428577 30.4178571 -1.31785714

Fluorescence : examen des résidus

Etalonnage

Quelle confiance peut-on avoir :

d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)

d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)

Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?

Ŷi = b1Xi + b0

Analyse de la régression linéaire

Etalonnage

b0 estimation de β0 de moyenne β0 et de variance var(b0)

b1 estimation de β1 de moyenne β1 et de variance var(b1)

(xi - x)2Var(b1) =2

exp. [ ]2 1n +et Var(b0) =

x2

(xi - x)2

Comme la variable Y qui intervient dans ces calculs est une variable aléatoire de variance σ2

exp.

cette dispersion va se répercuter sur les variances de b0 et b1.

Significativité des coefficients

Etalonnage

On appelle cette estimation variance de la régression ou variance résiduelle

n-2̂2 =ri

2

n-2̂2 = s2 =yib0 b1xi)2

La variance expérimentale peut être obtenue par 1. la répétition des essais ou 2. « estimée » à partir des résidus, selon la relation

suivante :

Estimation de la variance expérimentale

Etalonnage

Calcul de la variance des estimateurs (coefficients)(en utilisant la variance résiduelle comme estimation de σ2

exp. )

var(b1) = σ2résid . * (1/28) = 1,235 * 0,036 = 0,044

var(b0) = σ2résid . * (1/7 + 3*3/28) = 1,235* 0,464 = 0,574

Coefficient Ecart-type

b0 -0,418 0.757

b1 5,139 0.21

Fluorescence : Significativité des coefficients

Etalonnage

Le coefficient bi est distribué selon une distribution de Student de moyenne i, d'écart-type e.t.(bi) et (n-2) degrés de liberté.

Intervalle de confiance pour bi : bi tc e.t.(bi)

-tc tc

Moyenne = i

pour= n-2


Etalonnage

Intervalles de confiance des bi :

b1 ± tc e.t. (b1)b0 ± tc e.t. (b0)

Il s’agit ici du tthéorique avec ν = 5 Pour le risque choisi (0,05) t = 2,57)

-2,36 < b0 < 1,53 4,98 < b1 < 5,30

-0,418 ± 2,57*0,757 5,139 ± 2,57*0,21

Si l’intervalle inclus le zéro, le coefficient n’est pas significatif(au risque choisi)


Etalonnage

La significativité va être déterminée en

prenant βi0 = 0 d’où :

t =bi

é.type (bi)

D’où le test suivant :

la différence bi - βi0 suit une statistique de

Student à ν = (n-2) degrés de liberté avec :

t =bi - β0

i

é.type (bi)


Etalonnage

Etalonnage de la méthode d’analyse de traces par fluorescence, avec un risque =0,05 et avec =7-2=5 degrés de liberté,

coefficients écart-type tcalculé significativité

-0,418

5,139

0,757

0,210

-0,552

24,41

0,6046

0,0036

b0

b1

t5, 0.05 =2,57

(calculé avec LOI.STUDENT.INVERSE d'EXCEL).


Etalonnage

Avec Excel: Outil, Utilitaire d’analyse


1. Coefficients de régression

2. Analyse de variance (test de F1)

3. Calcul, significativité et intervalles de confiances

des coefficients

4. Analyse des résidus


Etalonnage

B = (X'X)-1 X'YB = (X'X)-1 X'Y

Coefficients du modèle

C'est une matrice où les variances sont disposées sur la diagonale et les covariances de part et d'autre de cette diagonale (matrice carrée symétrique) :

Matrice de variance-covariance des coefficients

Résolution matricielle

Etalonnage

n

22i

i 1

1ˆ x x

n 1

x

n

22i

i 1

1ˆ x x

n 1

y yi - y

n

22i

i 1

1ˆ x x

n 1

x,y yi - y

n22

ii 1

1ˆ x x

n 1

Variance de x

Variance de y

Covariance xy

Variance-covariance

Etalonnage

var (b0)cov (b1,b0) var (b1)

var (B) =

Var(B) = 2 (X'X)-1

Variance expérimentale Variance expérimentale

Conséquence: le choix des points expérimentaux conditionne la qualité de l’estimation la meilleure estimation consiste à annuler la covariance et minimiser les variances sur les coefficients Plan d’expériences

Matrice de variance-covariance des coefficients

Etalonnage

LOD = 1) Plus petite quantité d’analyte dont on puisse dire avec un niveau de confiance donné qu’il est présent dans l’échantillon2) Plus petite quantité de l’élément à analyser pouvant être détectée, mais non quantifiée par une valeur précise (ICH).3) …, mais non quantifiée par une valeur exacte (SFSTP 1997).

LOQ = 1) Plus petite quantité d’analyte qui peut être quantifiée avec un niveau de confiance donné.2) Plus faible concentration de l’analyte dans l’échantillon qui puisse être déterminée quantitativement avec une justesse et une précision convenables (ICH).3) Plus petite quantité à examiner dans un échantillon pouvant être dosé dans des conditions expérimentales décrites avec une fidélité et une exactitude définies (SFSTP 1997)

Définitions LOD/LOQ

Documents

Etalonnage et modélisation