Upload
porter-rhodes
View
29
Download
0
Embed Size (px)
DESCRIPTION
Etalonnage et modélisation. 11ème MIEC - 21ème JIREC Multimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie 1er, 2 et 3 Juin 2005 à Autrans. Standards de calibration: Fonction réponse. - PowerPoint PPT Presentation
Citation preview
Etalonnage
11ème MIEC - 21ème JIRECMultimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie
1er, 2 et 3 Juin 2005 à Autrans
Etalonnage
sig
na
l
ImpuretésProduits de dégradation
Standards de calibration: Fonction réponse
Contrôle qualité: Linéarité, Répétabilité, fidélité intermédiaire, exactitude
domaine
OBJECTIFS
Déterminer une procédure d’étalonnage inverse adapté.
1a. Intervalle de dosage1b. Fonction réponse2. Evaluation des limites de
détection et de quantification3. Prédire une incertitude de
mesure à l’aide de QC (exactitude et précision)
Simulation du travail de routine à l'aide d'échantillons de concentrations connues.
Etalonnage/modélisation en sciences analytiques
Etalonnage
Réponse analytique
Teneur
LOQ
Gamme linéaire
Gamme dynamique
LOD
Détermination de la borne supérieure du domaine linéaire
Permission J. Vial – Paris
Estimation LOD/LOQ
Domaine d’analyses
Etalonnage
Modéliser : utiliser des données expérimentales pour prévoir une
information quantitative inconnue Y à partir de mesures de X via une
certaine « fonction mathématique » :
Le modèle mathématique postulé peut être :
Sinon un polynôme de
degré convenable.
Ajustement polynomialY
X
Modèle Y = f(X) avec un
polynôme de degré convenable
Une droite si Y varie
linéairement avec X.
Ajustement linéaireY
X Y= b1X + b0Modèle
Modélisation
Etalonnage
Dans le cas les plus simple il existe une
relation linéaire entre :
et une seule grandeur physique Y
généralement donnée par un
appareil.
la grandeur à quantifier X
(ici la teneur de l’échantillon en un
composant donné)
Y = b1X + b0
Etalonnage/Relation linéaire
Etalonnage
Conclusion : les deux variables X et Y ne jouent pas le même rôle.
Quand on trace la courbe d’étalonnage d’une méthode d’analyse à partir d’étalons choisis par l’expérimentateur,
En revanche, la réponse Y obtenue est une variable aléatoire dans la mesure où elle dépend non seulement de X,
la concentration X de l’analyte n’est pas considérée comme variable aléatoire puisqu’elle est connue avec précision.
mais aussi de l’aléa de l’erreur expérimentale.
Régression
Etalonnage
On peut disposer de n couples [xi,yi] pour deux variables X et Y que l’on
suppose liées : à chaque valeur de X est associée une valeur de Y avec la relation :
(Y = ß1X + ß0)
Y représente le résultat observé,
X représente une teneur connue en analyte
Mais, expérimentalement, à chaque valeur xi de X, on obtient une valeur
yi entachée de l’erreur expérimentale εi. On a en réalité :
yi = ß1xi + ß0 + εi
Régression linéaire
Etalonnage
Y représente le résultat observé,
X représente une teneur connue en analyte
la relation linéaire postulée devient : Y = b1X + b0
Avec uniquement une « estimation » des coefficients a et b du modèle postulé.
Y = ß1X + ß0
Ces données sont toujours en nombre limité,
elles ne représentent donc qu’un échantillon de la population de toutes les mesures de la teneur en analyte de l’étalon que l’on pourrait effectuer.
Analyse Quantitative et Etalonnage
Etalonnage
A cause de cette erreur εi associée à chaque couple [xi,yi], si on
représente graphiquement yi en fonction de xi,
mais un «nuage» de points plus ou moins écartés de cette droite idéale.
on ne va pas obtenir des points “idéalement alignés”,
Régression linéaire
Etalonnage
Avec une seule variable X le modèle s ’écrit :
Y
X1 X2 X3 X4 X5
Y1
Y2
Y3
Y4
Y5
X
Y= 0 + 1 X + r
Modèle linéaire
Etalonnage
Y
X1 X2 X3 X4 X5
Y1
Y2
Y3
Y4
Y5
X
r1
r2
r3
r4
r5
Y1
^
Avec une seule variable X le modèle s ’écrit : Y= 0 + 1 X + r
On mesure la somme des carrés des écarts ri
(écarts appelés "résidus") entre la valeur vraie et la valeur
estimée ŷn sur la
courbe.
Faire un ajustement c'est minimiser la "distance" S = [Yi -f( Xi)]2 = r i
2
Ajustement linéaire
Etalonnage
Pour minimiser S,
il suffit d'annuler les
dérivées partielles
de S par rapport à
0 et à 1 :
S/0 = S/1 = 0.
La somme S des carrés des écarts entre les valeurs expérimentales et les valeurs calculées par le modèle s’écrit :
S = Σ [yi - (0 + 1xi )]2 est une fonction de 0 et 1.
Droite des moindres carrés et efficacité d’un ajustement
Etalonnage
Soit un jeu de calibration dans la gamme de 0 à 6 nanomoles
(les unités de fluorescence mesurées sont exprimées dans une échelle arbitraire dépendante de la gamme de concentration).
N° desessais
Conc. Xen nM
Unités deFluoresc. Y
1234567
0123456
0,13,8
10,014,420,726,929,1
Régression linéaire exemple : Fluorescence
Etalonnage
La droite des moindres carrés correspondant aux données a donc pour équation :
Y = 5,139 X – 0,418
Droite d’étalonnage
0
10
20
30
0 1 2 3 4 5 6 7
nMUn
ité
de
flu
ore
scen
ce
Régression linéaire exemple : Fluorescence
Etalonnage
Dans ce système les i sont les inconnues que nous devons estimer :
(bi est l ’estimation calculée de i ).
1. Au sens des moindres carrés (résolution algébrique) :
(yi - y)(xi - x) 1 = b1 =^
(xi - x)2 0 = b0 = y - b1 Xet ^
2. Au sens des moindres carrés (résolution matricielle) :
Estimation des coefficients
Etalonnage
Avec Excel:
1. Fonction graphique : courbe de tendance
2. Fonctions algébriques (pente, ordonnee.origine)
3. Fonction matricielle : Droitereg
Y = 5,139 X – 0,418
Régression linéaire
Etalonnage
Quelle confiance peut-on avoir :
d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)
d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)
Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?
Ŷi = b1Xi + b0
Analyse de la régression linéaire
Etalonnage
Y-
(yi - y)2
Variation totale
SCET
r1
r2r3
r4
r5
SCERVariation résiduelle
(yi - yi)2^
+Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCEL=
Analyse globale : Analyse de variance
Etalonnage
Base de l’analyse de variance
Toute dispersion d’une série de données étant exprimée par la somme des carrés des écarts à la moyenne, on démontre la relation suivante sur laquelle est basée l’analyse de variance :
SCET = SCEL + SCER
Variation totale
(yi - y)2
Variation résiduelle
(yi - yi)2^Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
Analyse globale : Analyse de variance
Etalonnage
Régression
Sources de variation
Sommes desCarrés des Ecarts
Degrés de lib.
Carrés moyens
Résidus
Total
2-1=1
7-2=5
7-1=6
SCEL = 739,56 739,56
SCER = 6,175 1,235
SCET = 745,72
Y-Y-Y-
(yi - y)2
Variation totale
SCET
(yi - y)2
Variation totale
SCET
r1
r2r3
r4
r5
r1
r2r3
r4
r5
SCERVariation résiduelle
(yi - yi)2^
+ SCERVariation résiduelle
(yi - yi)2^
SCERVariation résiduelle
(yi - yi)2^
+Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCEL=Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCELVariation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCEL=
Fluorescence : Analyse de la variance
Etalonnage
Pour savoir si les variances des deux échantillons sont identiques ou différentes, il faut effectuer un test de comparaison de variances.
Loi de Fisher (dite aussi de Fisher-Snedecor)
Si deux échantillons de tailles n1 et n2 proviennent de lois normales de même variance,
le rapport F des variances estimées suit une loi de Fisher avec ν1 = n1 – 1 et ν2 = n2 – 1 qui sont les degrés de liberté pour chacun des échantillons
s12
s22 = F (1
2 , 22)
Test de comparaison des variances
Etalonnage
Les distributions de la loi F sont caractérisées par une dissymétrie gauche.
f(F)
FCourbe pour 1 et 2 donnés 0
f(F)
FCourbe pour 1 et 2 donnés
f(F)
FCourbe pour 1 et 2 donnés 0
Fcalculé =Variance s2
1
Variance s22
estimée avec ν1 degrés de liberté
estimée avec ν2 degrés de liberté
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
Exemple pour1 = 5 et 2 = 5
Fi
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
Exemple pour1 = 5 et 2 = 5
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
Exemple pour1 = 5 et 2 = 5
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
0,08
0,06
0,04
0,02
00 1 2 3 4 5 6
Exemple pour1 = 5 et 2 = 5
Fi
On détermine la probabilité pour qu’une valeur de F soit inférieure à la valeur Fi portée en abscisse
S21 > S2
2 la plus grande variance au numérateur
Test de comparaison des variances
Etalonnage
Régression
Sources de variation
Sommes desCarrés des Ecarts
Degrés de lib.
Carrés moyens
Résidus
Total
2-1=1
7-2=5
7-1=6
SCEL = 739,56 739,56
SCER = 6,175 1,235
SCET = 745,72
Fcalc
598,8
F 1;5;0,05 = 6,608
Signif.
2,12.10-6
Y-Y-Y-
(yi - y)2
Variation totale
SCET
(yi - y)2
Variation totale
SCET
r1
r2r3
r4
r5
r1
r2r3
r4
r5
SCERVariation résiduelle
(yi - yi)2^
+ SCERVariation résiduelle
(yi - yi)2^
SCERVariation résiduelle
(yi - yi)2^
+Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCEL=Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCELVariation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^Variation due à la liaison
(yi - y)2 = (yi - y)2^ ^ ^
SCEL=
Fluorescence : Analyse de la variance
Etalonnage
La mesure de l'efficacité de l'ajustement peut être exprimée par un coefficient appelé “coefficient de détermination” ou “coefficient de régression multiple”.
Si le modèle expliquait “idéalement” les résultats expérimentaux,
nous aurions SCET = SCEL
ou sous une autre forme SCEL/SCET =1
Pour un modèle parfait : SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).
SCET = SCEL + SCER
Analyse globale : coefficients de régression
Etalonnage
R2 = SCEL / SCET
R2 = 1 -SCER
SCET
R2 = (SCET–SCER)/ SCET
SCEL=SCET – SCER
R2 est la part de la dispersion expliquée par le modèle.
Pour un modèle parfait, R2 = 1 car SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).
Coefficient de détermination R²
Etalonnage
R2 = 0.820
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
0 2 4 6 8 10 12 14
R2 = 0.820
0
0.2
0.4
0.6
0.8
1
1.2
1.4
0 2 4 6 8 10 12 14
R2 = 0.820
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
0 2 4 6 8 10 12 14
R2 = 0.820
0
0.5
1
1.5
2
2.5
3
0 2 4 6 8 10 12 14
R2 = 0.820
R2 = 0.820 R2 = 0.820
R2 = 0.820
Fonction réponse : R²
Etalonnage
Pour tenir compte du nombre d'essais, c'est à dire du nombre de degrés de liberté,
il existe un coefficient de régression "ajusté"
symbolisé par R2a et défini par :
Le rapport R2 n’est pas une garantie de la qualité d’un modèle (dépendance du nombre d’essais et du modèle choisi)
Ex. Avec deux points, droite; R2 = 1Avec trois points , droite; R2 < 1 mais 2ème degré R2 = 1
SCER /(n-p)
SCET /(n-1)R2a = 1-
Coefficient de détermination ajusté R²a
Etalonnage
R2 = 1 – (6,175/745,72) = 0,9917
R2a = 1 – ((6,175/5)/(745,72/6) = 0,9900
R2 = 1 -SCER
SCET
R2 = 1 -SCER
SCET
R2 = 1 -SCER
SCET
SCER /(n-p)
SCET /(n-1)R2a = 1-
SCER /(n-p)
SCET /(n-1)R2a = 1-
Fluorescence : coefficients de régression
Etalonnage
Résidus = écarts entre les points expérimentaux et la droite de régression
0
50000
100000
150000
200000
Y
0 0,5 1 1,5 2
X
-1500-1000-500
0500
10001500
Res
idua
l
0 0,5 1 1,5 2
X
Les résidus devraient suivre une loi normale centrée sur 0.
Un examen visuel permet généralement de déceler un problème de modèle (homoscédasiticité, courbure, ordre supérieur, etc.).
Analyse globale : examen des résidus
Etalonnage
Une courbe en cloche asymptotique à l’axe des x, dont le
maximum est pour x = x ,
Le graphe de la Loi Normale est caractérisé par :
Une symétrie par rapport à l’axe x = x,
Deux points d’inflexion à une distance de x égale à σ.
Moyenne
n
ii 1
1x x
n
n
22i
i 1
1ˆ x x
n 1
Variance
x x,
2
2
2
2
f x
f x
IC x
ICx
Propriétés de la loi Normale
Etalonnage
Probabilité = 68,27% pour que x soit compris dans l’intervallex 1
0,6827 0,9545
Probabilité = 95,45% pour que x soit compris dans l’intervallex 2
0,9973
Probabilité = 99,73% pour que x soit compris dans l’intervallex 3
Propriétés de la loi Normale
Etalonnage
99,73 %
En moyenne, l’erreur est nulle :
Distribution de Gauss centrée sur zéro(échelle des abscisses en unités d’écart-type)
95,45 %
La dispersion de « ri" est mesurée par sa variance : var(ri) = 2
68,27 %
o
-3 -2 -1 1 2 3
l’espérance mathématique E(ri) =0.
ou par l’écart-type .
s
Caractéristiques de l’erreur expérimentale ri
Etalonnage
Concentration Graphique des résidus
-1.5
-1
-0.5
0
0.5
1
1.5
2
0 1 2 3 4 5 6 7
Concentration
Rés
idu
s
ANALYSE DES RÉSIDUS
ObservationPrévisions
Signal Résidus1 -0.41785714 0.517857142 4.72142857 -0.921428573 9.86071429 0.139285714 15 -0.65 20.1392857 0.560714296 25.2785714 1.621428577 30.4178571 -1.31785714
Fluorescence : examen des résidus
Etalonnage
Quelle confiance peut-on avoir :
d’une part globalement pour la régression,- Analyse de variance / coefficients- Examen des résidus- Manque d’ajustement (Lack of fit)
d’autre part individuellement pour les estimateurs ?- Simplification du modèle- Pertinence quadratique (global)
Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ?
Ŷi = b1Xi + b0
Analyse de la régression linéaire
Etalonnage
b0 estimation de β0 de moyenne β0 et de variance var(b0)
b1 estimation de β1 de moyenne β1 et de variance var(b1)
(xi - x)2Var(b1) =2
exp. [ ]2 1n +et Var(b0) =
x2
(xi - x)2
Comme la variable Y qui intervient dans ces calculs est une variable aléatoire de variance σ2
exp.
cette dispersion va se répercuter sur les variances de b0 et b1.
Significativité des coefficients
Etalonnage
On appelle cette estimation variance de la régression ou variance résiduelle
n-2̂2 =ri
2
n-2̂2 = s2 =yib0 b1xi)2
La variance expérimentale peut être obtenue par 1. la répétition des essais ou 2. « estimée » à partir des résidus, selon la relation
suivante :
Estimation de la variance expérimentale
Etalonnage
Calcul de la variance des estimateurs (coefficients)(en utilisant la variance résiduelle comme estimation de σ2
exp. )
var(b1) = σ2résid . * (1/28) = 1,235 * 0,036 = 0,044
var(b0) = σ2résid . * (1/7 + 3*3/28) = 1,235* 0,464 = 0,574
Coefficient Ecart-type
b0 -0,418 0.757
b1 5,139 0.21
Fluorescence : Significativité des coefficients
Etalonnage
Le coefficient bi est distribué selon une distribution de Student de moyenne i, d'écart-type e.t.(bi) et (n-2) degrés de liberté.
Intervalle de confiance pour bi : bi tc e.t.(bi)
-tc tc
Moyenne = i
pour= n-2
Significativité des coefficients
Etalonnage
Intervalles de confiance des bi :
b1 ± tc e.t. (b1)b0 ± tc e.t. (b0)
Il s’agit ici du tthéorique avec ν = 5 Pour le risque choisi (0,05) t = 2,57)
-2,36 < b0 < 1,53 4,98 < b1 < 5,30
-0,418 ± 2,57*0,757 5,139 ± 2,57*0,21
Si l’intervalle inclus le zéro, le coefficient n’est pas significatif(au risque choisi)
Fluorescence : Significativité des coefficients
Etalonnage
La significativité va être déterminée en
prenant βi0 = 0 d’où :
t =bi
é.type (bi)
D’où le test suivant :
la différence bi - βi0 suit une statistique de
Student à ν = (n-2) degrés de liberté avec :
t =bi - β0
i
é.type (bi)
Significativité des coefficients
Etalonnage
Etalonnage de la méthode d’analyse de traces par fluorescence, avec un risque =0,05 et avec =7-2=5 degrés de liberté,
coefficients écart-type tcalculé significativité
-0,418
5,139
0,757
0,210
-0,552
24,41
0,6046
0,0036
b0
b1
t5, 0.05 =2,57
(calculé avec LOI.STUDENT.INVERSE d'EXCEL).
Fluorescence : Significativité des coefficients
Etalonnage
Avec Excel: Outil, Utilitaire d’analyse
Régression linéaire
1. Coefficients de régression
2. Analyse de variance (test de F1)
3. Calcul, significativité et intervalles de confiances
des coefficients
4. Analyse des résidus
Régression linéaire
Etalonnage
B = (X'X)-1 X'YB = (X'X)-1 X'Y
Coefficients du modèle
C'est une matrice où les variances sont disposées sur la diagonale et les covariances de part et d'autre de cette diagonale (matrice carrée symétrique) :
Matrice de variance-covariance des coefficients
Résolution matricielle
Etalonnage
n
22i
i 1
1ˆ x x
n 1
x
n
22i
i 1
1ˆ x x
n 1
y yi - y
n
22i
i 1
1ˆ x x
n 1
x,y yi - y
n22
ii 1
1ˆ x x
n 1
Variance de x
Variance de y
Covariance xy
Variance-covariance
Etalonnage
var (b0)cov (b1,b0) var (b1)
var (B) =
Var(B) = 2 (X'X)-1
Variance expérimentale Variance expérimentale
Conséquence: le choix des points expérimentaux conditionne la qualité de l’estimation la meilleure estimation consiste à annuler la covariance et minimiser les variances sur les coefficients Plan d’expériences
Matrice de variance-covariance des coefficients
Etalonnage
LOD = 1) Plus petite quantité d’analyte dont on puisse dire avec un niveau de confiance donné qu’il est présent dans l’échantillon2) Plus petite quantité de l’élément à analyser pouvant être détectée, mais non quantifiée par une valeur précise (ICH).3) …, mais non quantifiée par une valeur exacte (SFSTP 1997).
LOQ = 1) Plus petite quantité d’analyte qui peut être quantifiée avec un niveau de confiance donné.2) Plus faible concentration de l’analyte dans l’échantillon qui puisse être déterminée quantitativement avec une justesse et une précision convenables (ICH).3) Plus petite quantité à examiner dans un échantillon pouvant être dosé dans des conditions expérimentales décrites avec une fidélité et une exactitude définies (SFSTP 1997)
Définitions LOD/LOQ