Rapport TOTAL

Preview:

DESCRIPTION

Rapport

Citation preview

MASTER 2 « Optimisations des Protocoles Expérimentaux » Université de Bretagne Occidentale Avenue Le Gorgeu 29200 Brest

ESTIMATION DE L’INCERTITUDE SUR LE GAZ

PRODUIT GLOBAL DU CHAMP RIO DEL REY

(CAMEROUN)

Exploration Production

Direction Hygiène Sécurité Environnement

Département Environnement

LACOUR Cédric

Promo 9

Session 2006-2007

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

REMERCIEMENTS

Je tiens avant tout à remercier la société TOTAL et M. Jean-Yves DURIEUX,

Directeur du service Hygiène, Sécurité, Environnement (HSE) de la Direction Générale

Exploration Production (DGEP), pour m’avoir accueilli durant ces quatre premiers mois de

stages de fin d’études du Master 2 Professionnel « Optimisations des protocoles

expérimentaux ».

Je remercie plus particulièrement M. Roger CAMPS, responsable du service

Environnement au sein de la DGEP/HSE, ainsi que Michel GRANDPRAT pour m’avoir

confier la réalisation de cette mission et pour avoir eu confiance en mes capacités à la mener à

bien.

Je me permets d’exprimer toute ma gratitude à l’égard de Mathieu MURRAY, mon

tuteur, pour son expérience et son savoir-faire qui m’ont permis d’être initié au monde

pétrolier ainsi que pour sa disponibilité. Ses recommandations et son esprit critique m’ont été

d’une aide précieuse dans la réalisation de mes différentes tâches.

Merci également à Jean-Paul Valois, de la Direction Géosciences (GSR) Département

Valorisation des gisements (VDG) pour m’avoir accordé du temps lors des visites à Pau. Ses

conseils et formations ont fortement contribué à l’avancement de mes travaux ainsi que les

informations apportées par l’équipe du Département Technologies Géosciences (TG).

J’exprime mes remerciements à Benjamin MAKAYA, de la filiale Cameroun, pour

m’avoir fourni les données ainsi qu’à son équipe pour avoir répondu à mes questions.

Enfin je souhaite adresser de sincères remerciements à tous les membres de la Direction

HSE et les stagiaires pour leur accueil chaleureux et la sympathie qu’ils m’ont témoigné.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 2

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

ABSTRACT

TOTAL produces yearly an Environment Report for each affiliate in which is given

the inventory of the production of waste, the fresh water consumption, the atmospheric emissions… These Environment Reports are audited to be consistent at the Group level. The gas production of Rio Del Rey field in Cameroon was not considered satisfactory by the external auditors. This is due in particular to the absence of accurate measurements on the site.

In spite of these fluctuating data, the object of the study was to analyse, with a statistical approach, well test data to have a better understanding of the results, to model the production of gas and to estimate the uncertainty associated to this production. This study is a useful attempt to avoid heavy modifications of the existing count.

As a supplement to exploratory analyses (analysis of variance ANOVA, curve Qgaz = f (Time) …), allowing to discover the influential factors on well production and to proceed to groupings (wells with gas, with oil), two approaches appear:

• The "Deterministic" one, using multivariate analysis tools of Unscrambler (Principal Component Analysis, Partial Least Square …). These tools, owing to the lack of information, seemed not to be conclusive and did not allow to show groups of population as only 30 % of the information was explained and 50 % of the quantity of produced gas was predicted.

• The "Probabilistic" one, consisting in the application of a regression method (called LOESS) with the use of a SAS module developed by a TOTAL statistician. It allowed, by curve smoothing versus time (moving average), to estimate punctual uncertainties. This technique also required a command of certain parameters (fluids, oilfield specific …) aiming at a sharper exploratory analysis.

It appears that multivariate analysis tools are not adapted because of a lack of

information of good quality and a too high uncertainty on the average (± 184%). Another way to explore is interpolation (production of new data) coupled with LOESS

regression. This method leads to an uncertainty of 5%. Thanks to the goods results, I recommend to follow in this way.

Key words: environment report, gas assessment, well test, data analysis, LOESS regression.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 3

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

SOMMAIRE

I. Introduction .................................................................................................................... 5 II. Généralités...................................................................................................................... 6

A. Contexte de la mission ................................................................................................... 6 B. Problématique................................................................................................................. 7

1. Données en présence .................................................................................................. 7 2. Informations collectées sur le champ Rio Del Rey et sur les essais de puits ............. 9

C. Notion d’incertitude ..................................................................................................... 10 1. Évaluation des incertitudes....................................................................................... 10 2. Méthodes d’évaluation des incertitudes de type A et B ........................................... 11 3. Propagation des incertitudes..................................................................................... 11

D. Test d’hypothèse nulle et seuil de signification ........................................................... 12 III. Méthodes d’analyses et d’estimation de l’incertitude .................................................. 12

A. Analyse multivariée...................................................................................................... 12 1. Généralités sur l’ACP et la PLS............................................................................... 12

a) Analyse en Composantes Principales........................................................... 12 b) Partial Least Square...................................................................................... 13

2. Statistiques descriptives des variables...................................................................... 14 a) Analyse des variables ................................................................................... 14 b) Détection de groupes de données ................................................................. 15

3. Analyse ACP / PLS sur les données de tests de puits .............................................. 17 a) Général ......................................................................................................... 17 b) Durée de test > 0.5 jour ................................................................................ 19 c) Puits à gaz..................................................................................................... 20

4. Conclusion ACP/PLS............................................................................................... 21 B. Régression de LOESS : méthode des moyennes mobiles ............................................ 22

1. Principe..................................................................................................................... 22 2. Exemple général....................................................................................................... 22 3. Statistiques descriptives ........................................................................................... 23 4. Analyse de la régression LOESS sous SAS............................................................. 26

a) Méthode........................................................................................................ 26 b) Interpolation ................................................................................................. 27 c) Applications ................................................................................................. 27

5. Conclusions régression LOESS ............................................................................... 29 IV. Conclusion.................................................................................................................... 30 V. Recommandations ........................................................................................................ 31 GLOSSAIRE............................................................................................................................ 32

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 4

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

I. Introduction

En matière d’environnement, de nombreux sujets sont au cœur des préoccupations

mondiales : le réchauffement climatique bien sûr, mais aussi la pollution de l’air et de l’eau, la

dégradation accélérée de la biodiversité, la prolifération de déchets...

TOTAL est concerné par ces enjeux, qu’ils soient d’importance locale ou planétaire.

La démarche du GROUPE vise aussi à réduire les risques de pollutions et les émissions

néfastes pour l’environnement. La préservation de la biodiversité est par ailleurs au cœur de

ses préoccupations.

Danse ce sens, TOTAL se doit de fournir un rapport environnemental pour chacune de ses

filiales rendant compte des différents indicateurs environnementaux dont le bilan de gaz

produit.

En vue de déterminer ce bilan de gaz, mais aussi les débits d’eau et d’huile produits,

des tests de puits sont réalisés. En effet, l’absence de comptage en temps réel du flux

triphasique nécessite de passer par des essais de puits.

Dans leur rapport préliminaire les auditeurs d’ «Ernst & Young » ont relevé la nécessité

de faire diminuer l’incertitude sur le bilan gaz. Une analyse par un traitement statistique des

données de tests de puits sera réalisée pour minimiser cette incertitude afin d’éviter des

modifications lourdes du système de comptage (tests de puits).

Le stage consistera en l’utilisation des outils acquis lors de ma formation (analyse

multivariée, logiciel Unscrambler et Statistica) mais aussi ceux découvert durant mon stage

(régression LOESS, logiciel SAS).

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 5

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

II. Généralités

A. Contexte de la mission

Chaque année TOTAL produit un Reporting Environment visant à renseigner ses

filiales sur les indicateurs environnementaux (Émissions atmosphériques, la consommation

d’eau, les déblais de forage, …). Ce rapport doit être validé par des auditeurs externes.

Dans le Reporting Environment de la filiale E&P Cameroun de Décembre 2006, les auditeurs

ont estimé que l’incertitude sur le gaz produit global (non mesuré) n’était pas satisfaisante

voir inexistante.

En effet une approche de l’incertitude a été menée en la déduisant directement du Gas Oil Ratio (G.O.R).

Gaz Produit = ii

puitsn

puitspuitsdumentfonctionnetempsnciliéeoduiteRécoHuilepuitsGOR *Pr*

1∑

L’incertitude a été calculée de la manière suivante, en tenant compte de l’incertitude

de chaque terme :

)²()²PrPr()²(

PrPr

tionRéconciliationRéconcilia

oduiteHuileoduiteHuile

moyenGORmoyenGOR

oduitGazoduitGaz ∆

+∆

+∆

=∆

Soit oduitGazoduitGaz

PrPr∆ = )²01.0()²0025.0()²20.0( ++ %20≈

Comme dit précédemment, les débits ne sont pas mesurés en temps réel, il est donc

nécessaire d’effectuer des tests de puits. La réalisation de tests de puits validés est primordiale

pour le bilan et la stratégie production d’une filiale. En général, la production est triphasique

mais elle peut être diphasique (Huile + Gaz) en début de production d’un champ. En l’absence

d’un comptage triphasique en temps réel pour chaque puits, c’est le seul moyen pour

déterminer les caractéristiques principales du puits (Débits eau, gaz, huile) en fonction d’un

certain nombre de critères (Pression, température, duse, densité, …). Les résultats obtenus

permettront d’extraire un certain nombre de données et de ratios pour comprendre le

fonctionnement du puits et du réservoir dans le temps, et pour quantifier les volumes produits

(BSW, GOR, …).

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 6

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

B. Problématique

1. Données en présence Lors de ma mission, j’ai donc eu pour rôle d’estimer cette incertitude associée à une quantité

de gaz total produit sur une période de 6 ans (2000-2006). Ces données sont extraites de la

base ELISA du champ Rio Del Rey au Cameroun.

Par mes qualités de statisticien, j’ai du trouver des outils appropriés (analyse multivariée,

méthode de régression…) afin d’y voir clair dans les données d’essai de puits (Fig 1).

Fig 1. Échantillon du tableau de données.

Elles se composent de 6041 données de tests réparties sur 86 puits du champ Rio Del

Rey au Cameroun (Champ offshore Annexe 2). Ces mesures ont été effectuées sur une

période pouvant aller jusqu’à 6 ans pour certains puits (2000 – 20006).

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 7

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Ces tests sont caractérisés par les 14 variables et 5 réponses suivantes :

• Puits : Nom du gisement + type d’installation + N° de l’installation

Exemple EKM008 : EK = Ekoundou, M = puits (F pour plateforme), 008 =N° du puits.

• COL : Colonne ou Tubing, orifice par lequel remonte le liquide de production.

• Date : Date du test.

• Durée : Durée en jour du test.

• Duse : Orifice situé entre la tête de puits et le séparateur. Celui-ci est fixe en condition

de test et variable en condition de production. (Diamètre en ¼ de pouce). Il permet de

contrôler le débit du fluide qui jaillit.

• PTH / TTH : Pression et température en tête de puits.

• P inj : Pression de l’injection de gaz lift en tête de l’annulaire (en barg).

• P sep / T sep : Pression et température au niveau du séparateur.

• P res / T res : Pression et température du réseau « Gas Lift » (GL).

• Qgl : Débit de « Gas Lift¹ » injecté (Sm³ / j)*

• D15/4 : Densité de l’huile à 15°C par rapport à l’eau à 4°C (la plus dense).

• Q HA : Débit d’huile anhydre (m³/ j).

• Q EAU : Débit d’eau (m³ / j).

• Q Gaz : Débit de gaz associé (naturel) (Sm³ / j)

• BSW : Basic Sediment and Water, Pourcentage d’eau dans le fluide diphasique

huile/eau produit (%).

• GOR : Gas Oil Ratio, Volume de gaz produit ramené aux conditions standard par

volume d’huile produit. (Sm³ / m³).

* Aux conditions standards (15°C et 101,325 kPA).

Ce tableau est une synthèse des paramètres pouvant influer sur la réponse qui nous

intéresse (Q Gaz). Certains sont ajustables comme la duse, la pression d’injection GL, Qgl ou

encore la durée du test. D’autres sont mesurés (Pressions et températures en tête de puits, au

niveau séparateur, la densité, les débits …)

Face à ce nombre de données, différents problèmes se présentent : les liaisons entre les

variables, la présence de valeurs manquantes et de données aberrantes, la performance des

puits en fonction de leur durée de vie …

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 8

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Une approche statistique de ces paramètres permettra donc de faire le tri dans les

données, d’établir des relations entre variables et de prédire une réponse au cours du temps

associée à une incertitude.

2. Informations collectées sur le champ Rio Del Rey et sur les essais de puits

• Les puits sont supposés être testés une fois par mois (deux fois s’ils nécessitent un

suivi particulier). Ou moins, s’ils sont jugés stables.

• Des puits produisent du gaz et servent à la réallocation c.à.d que le gaz produit est

redistribué sur d’autres plateformes afin de faciliter et d’améliorer la production

d’huile en injectant ce gaz (dit gaz lift), ce qui a pour conséquence d’alléger la colonne

de fluide. (BOM203 LS puits à gaz Haute Pression, BOM009 qui a un fort G.O.R,

ASM032G utilisé en appoint du réseau « Compression Zone Est », …).

• Depuis 2004, l’objectif du puits EKM038 est de fournir des gaz pour l’activation des

puits. On est dans le même cas de figure pour les puits BOM203 et NHM001.

• Il existe 2 origines pour la production de gaz : la première est le gaz dissout en

condition fond de puits et la seconde est le gaz présent dans le réservoir aux conditions

(P, T) réservoir (saturation en gaz > 0, « coning » en provenance d’une couche de gaz

au dessus).

• Pour la majorité des puits, lors des tests, il faut un temps de stabilisation relativement

long surtout si ces puits sont en Gas Lift.

• Un puits commence à être mauvais producteur lorsqu’il produit le gaz en provenance

du « gas cap » qui est au dessus de la couche d’huile.

• Les puits BOM012 et INM009 sont atteints par du « gas coning ».

• Les gisements ont la même signature géochimique mais ils diffèrent par le degré de

lessivage. Il y a une migration des hydrocarbures de le roche mère vers les différents

pièges constituant les réservoirs.

• Lors des mises en route des puits, un dégazage est effectué.

• Les données d’essais de puits sont difficilement transposables aux données de

production. Ceci est dû aux conditions qui diffèrent. (ex : le diamètre des duses n’est

pas le même en essai ou en production).

• Plus un test est long, meilleur est sa performance.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 9

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

• Il est préférable de raisonner sur le champ et non par puits car les données sont trop

biaisées.

C. Notion d’incertitude

Évaluer l’incertitude sur une mesure est un domaine complexe qui fait l’objet d’une branche complète : La métrologie. Vocabulaire G : Mesurande, grandeur à mesurer. g : Mesure de la grandeur G ; u (G) : Incertitude type. U (G) : Incertitude élargie.

gGU )( = Incertitude relative.

1. Évaluation des incertitudes

Il faut un instrument de mesure construit sur un étalon. Malgré tout, cet instrument possède aussi une certaine précision. L’acte de mesurer entraîne deux types d’erreurs :

• Évaluations de type A

C’est le cas où une série de mesures est effectuée. Le traitement des erreurs est

statistique : moyenne, écart type, … Cette analyse statistique se fait lorsqu’on a peu d’indications sur les sources d’erreurs.

• Évaluation de type B

Il est impossible de faire un calcul statistique. Il faut chercher et évaluer les sources

d’erreurs. Le constructeur de l’instrument de mesure fournit des données telles que la classe de l’appareil, le calibre, la résolution. Il est nécessaire d’avoir une connaissance générale de l’expérience ou du process.

• Incertitudes composées

Dans certains cas complexes, il fau souvent combiner les deux méthodes pour obtenir

une meilleure évaluation de l’incertitude.

u (G) = )()( 22 GuGu BA +

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 10

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

2. Méthodes d’évaluation des incertitudes de type A et B

• Type A

Dans le cas de plusieurs mesures indépendantes, l’incertitude se calcule à l’aide de l’écart type d’ordre n-1 (appelé écart type de l’échantillon). On prend alors comme valeur de g, la moyenne des mesures. Si la distribution des mesures suit une loi gaussienne, alors les observations montrent que l’écart type de l’échantillon est un bon estimateur de l’incertitude pour un très grand nombre de mesures.

• Type B

Il est nécessaire de faire un bilan des erreurs :

- les erreurs systématiques telles que les erreurs de méthodes, le vieillissement des composants, le réglage du zéro de l’appareil, … - les erreurs aléatoires telles que les erreurs de lecture ou dues à l’appareil lui-même ou dues aux conditions extérieures (température et dilatation, pression atmosphérique, …)

Dans un tel cas de figure, pour arriver à exprimer l’incertitude sous la forme d’un écart type, on peut changer d’instrument de mesure, voire de protocole, faire varier les paramètres influents.

• Incertitude élargie

Le problème, et notamment dans le cas d’une évaluation de type B pour laquelle le

calcul statistique n’est pas possible, est qu’il faut donc arriver à faire « confiance » à notre écart type, en l’élargissant :

Si les mesures sont équiprobables et que l’on connaît et , l’incertitude élargie se calcule en multipliant u par un cœfficient d’élargissement k :

maxg ming

U = k*u avec k = 2 pour une confiance à 95%. k = 3 pour une confiance à 99%.

3. Propagation des incertitudes Si une grandeur « y » se déduit de grandeurs « », par une formule du type : ix y = f( ), alors l’incertitude se calcule par ...21 ++ xxSi les mesures sont indépendantes (non corrélées).

D’une manière plus simple .....)²()²()(22

221

1 ++=xxu

xxu

yyu

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 11

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

D. Test d’hypothèse nulle et seuil de signification

Un test d'hypothèse est une démarche consistant à rejeter ou à accepter une hypothèse statistique, appelée hypothèse nulle, en fonction d'un jeu de données (échantillon). L'hypothèse nulle H0 est une hypothèse de non différence (il n'y a pas de différence significative entre les échantillons A et B). Elle est formulée de façon à être rejetée. Dans le cas de son rejet, l'hypothèse alternative (H1) (il y a une différence significative entre les échantillons A et B) doit être acceptée.

Le calcul de probabilité « p » correspond à la probabilité que l'hypothèse nulle soit vraie (ou à la probabilité de se tromper en rejetant l'hypothèse nulle). Si p>0,05 (α = 5%), on ne peut pas rejeter l'hypothèse nulle. On dit qu'il n’y a pas de différence significative entre les deux échantillons.

Le risque α = 5% signifie qu’il n'y a que 5 chances sur 100 pour que l'écart entre la variable et sa valeur moyenne dépasse 2 fois l'écart type (Fig.2).

Fig 2. Seuil de signification (acceptation / Rejet)

III. Méthodes d’analyses et d’estimation de l’incertitude

A. Analyse multivariée

L’analyse multivariée est une étude statistique des relations pouvant exister entre plusieurs

variables. L’Analyse en Composantes Principales (ACP) et la méthode Partial Least Square

(PLS) sont deux des techniques de la famille des analyses multivariées. Ces deux méthodes

seront effectuées avec le logiciel « UNSCRAMBLER ».

1. Généralités sur l’ACP et la PLS

a) Analyse en Composantes Principales L'étude d'une population statistique de taille n passe le plus souvent par le recueil d'un

nombre élevé p de données quantitatives par élément observé. L'analyse de ces données doit

tenir compte de leur caractère multidimensionnel et révéler les liaisons existantes entre leurs

composantes.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 12

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

L'analyse en composantes principales (ACP), introduite en 1901 par K. Pearson [4] et

développée par H. Hotelling en 1933 [1], est une méthode très puissante pour explorer la

structure de telles données. Chaque donnée étant représentée dans un espace à p dimensions,

l'ensemble des données forme un "nuage de n points" dans Rp. Le principe de l'ACP est

d'obtenir une représentation approchée du nuage dans un sous-espace de dimension faible k

par projection sur des axes bien choisis. Une métrique dans Rp étant choisie (en général

normalisée par l'utilisation de variables centrées réduites), les k axes principaux sont ceux qui

maximisent l'"inertie" du nuage projeté, c'est-à-dire la moyenne pondérée des carrés des

distances des points projetés à leur centre de gravité. Les composantes principales sont les n

vecteurs ayant pour coordonnées celles des projections orthogonales des n éléments du nuage

sur les k axes principaux.

Les composantes sont les axes principaux de l’ellipsoïde d’information dans Rp.

L'ACP construit ainsi de nouvelles variables, artificielles, et des représentations

graphiques permettant de visualiser les relations entre variables, ainsi que l'existence

éventuelle de groupes d'éléments et de groupes de variables.

L'interprétation de ces représentations est délicate et doit respecter une démarche

rigoureuse.

b) Partial Least Square Développée par Wold dans les années 1960 [2], la régression PLS (Partial Least

Squares) est une technique permettant de contourner certains obstacles (valeurs manquantes,

nombre de variables explicatives supérieurs au nombre d’observations …). Elle peut être

perçue comme une généralisation de la Régression Linéaire Multiple (mais également de

la Régression sur Composantes Principales et de l'Analyse Canonique).

La Régression PLS remplace l'espace initial des (nombreuses) variables explicatives par

un espace de faible dimensionnalité, sous tendu par un petit nombre de variables appelées

"facteurs" ou "variable latentes" qui sont construits l'un après l'autre de façon itérative. Ces

facteurs seront les nouvelles variables explicatives d'un modèle de régression linéaire

classique.

Les facteurs sont orthogonaux (non corrélés), et sont des combinaisons linéaires des

variables explicatives initiales. Mais alors que ces derniers ne sont calculés qu'à partir des

variables initiales (et donc sans référence à la réponse y), les facteurs de la régression PLS

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 13

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

prennent en compte leur utilité individuelle pour prédire y en maximisant leurs corrélations

successives avec y, tout en maintenant la contrainte d'orthogonalité avec les facteurs déjà

construits.

La régression PLS est utilisable même sur des variables nominales (explicatives ou à

expliquer) par le biais d'un codage sous forme de la création de variables indicatrices binaires.

C’est la technique principale de modélisation prédictive dans les situations où les prédicteurs

sont plus nombreux que les observations, fortement corrélés, et avec de nombreuses données

manquantes. Son champ d'application essentiel est la chimiométrie, mais la régression PLS est

très générale, et se développe rapidement dans tous les domaines (économie, médecine,

psychologie etc...).

2. Statistiques descriptives des variables

a) Analyse des variables Dans le but d’analyser les données par le biais de l’analyse multivariée, la première

étape consistera à analyser chaque variable.

Une étude de dispersion des données pour chaque variable pourrait être réalisée mais le

nombre de valeurs ne nous permet pas de la faire. Le meilleur test connu à ce jour est

« Shapiro et Wilk » [3] mais celui-ci ne prend en compte qu’un maximum de 5000 données

(Dans notre cas, il y en a plus de 6000). Éventuellement, cette analyse pourra être effectuée

lorsque des groupes auront été constitués.

L’analyse préliminaire consiste également à détecter les anomalies et à observer le

comportement des variables.

Les logiciels ne permettant pas de faire de test de normalité sur un grand nombre de

variables, on peut donc utiliser des histogrammes « fréquence = f (variables) » et s’apercevoir

que sur certaines variables, des valeurs semblent s’écarter très sensiblement de la moyenne.

En questionnant les spécialistes, j’ai jugé, selon le cas, s’il fallait éliminer ces valeurs

extrêmes ou au contraire en tenir compte dans l’analyse.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 14

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

b) Détection de groupes de données L’un des enjeux importants de cette première approche est d’essayer de trouver des

groupes de données bien définis. Cette partie de l’analyse a été réalisée grâce à un module

développé sous « SAS » par un statisticien de TOTAL (Jean Paul Valois).

Le graphique « Qgaz = f (durée) » présente une bimodalité (Fig 3). Après discussion, il

ressort que cela est dû à la stabilisation des tests de puits. On considère généralement qu’un

puits est stable à partir de 6 heures de test. Dans notre cas on voit qu’il faut une demi-journée

pour qu’il se stabilise. Plus un test est long, meilleur est sa performance.

L’une des premières pistes sera donc de séparer les puits en fonction de la durée de test. Or il

n’y a que 1/10 des tests qui sont supérieurs à une demi-journée.

Fig 3. Graphique de la durée de test en fonction de la quantité de gaz produit.

(Qgas est en Sm³/j et Durée en jour)

Une autre approche est de séparer les puits suivant la qualité des fluides qu’ils

produisent.

Rio Del Rey étant en production depuis longtemps, certains puits produisent beaucoup de gaz

et d’autres sont des puits à huile. Pour cela il faut utiliser la variable G.O.R qui est le ratio

gaz/huile. Pour chaque puits, son évolution a été tracée.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 15

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Au dernier test connu pour chaque puits, 6 d’entre eux (soit 1/10) présentent un G.O.R

supérieur à 1000 Sm³/m³. Ces puits sont considérés comme des puits à gaz et produisent ¼ de

la quantité de gaz du champ.

Le graphique suivant, de la quantité de gaz produit en fonction du G.O.R, permet

également de voir quels sont les puits bons producteurs d’huile ou de gaz.

Fig 4. Graphique de la quantité de gaz produit en fonction du G.O.R.

Il existe différents types de puits :

• Faible GOR + Fort Qgas = bons producteurs d’huile.

• Fort GOR + Fort Qgas = producteurs de gaz. Dans ce cas l’arrivée massive de gaz

peut être due à ce que l’on appelle du « gas coning¹» ou bien les puits ont

volontairement été reperforés au sommet de la structure où un accumulation de gaz

s’est produite (ou gas cap¹) afin d’être redistribué pour l’activation des puits.

Un puits est considéré comme mauvais producteur lorsque le G.O.R de production

devient supérieur au Rs initial. Le Rs¹ est l’équivalent du G.O.R mais au niveau du réservoir.

Ainsi un G.O.R est considéré comme mauvais à partir d’une valeur comprise entre 200

et 500 Sm³/m³. Cela dépend du volume du réservoir considéré.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 16

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Un puits est dit « Bon producteur » lorsqu’il produit de l’huile en grande quantité (faible

G.O.R).

Nous avons donc là un autre aspect à traiter : séparation des puits à gaz ou à huile.

Une première étape exploratoire étant réalisée, on va pouvoir affiner l’étude par une

analyse multivariée. A la vue du nombre de tests et de variables, l’analyse multivariée semble

être une étape préalable et primordiale à l’examen des données.

3. Analyse ACP / PLS sur les données de tests de puits L’ACP / PLS va permettre d’établir un modèle avec les variables explicatives à partir

duquel on extrait un écart-type. Celui-ci aura une relation directe avec l’incertitude recherchée

sur la base de la formule suivante :

Y° = Ym ± t*(SEP)

Ym = Y moyen

Y° = Y vrai

t = correspond au “t” de la loi de Student au risque α = 5% (ici t = 1.96)

SEP = Standard Error of Prediction.

n = nombre d’échantillons.

a) Général Après élimination des points aberrants (« outliers ») grâce au graphique des « scores »,

des « résidus » ainsi que par l’intermédiaire de l’ « effet de levier », on observe le

comportement des 12 variables. (9 points seront exclus selon un critère commun de « P sep »

trop élevé). 9 composantes sont utiles pour expliquer 94% de la variance totale. Les deux

premières composantes (les plus explicatives) ne renseignent seulement que 46% de la

variance des X.

Ceci montre que les variables sont, en grande partie, indépendantes.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 17

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Fig 5. Variance expliquée et poids

des variables (Unscrambler).

Le tableau des corrélations confirme ce point, les variables les plus corrélées sont la

température en tête de puits et celle séparateur r (TTH, Tsep) = 0.757. Viennent ensuite

r (PTH, duse) = r (PTH, Psep) = r (PTH, Qgl) = 0.55.

Le graphique des « loadings » (Fig 5) montre également les relations existantes entre

variables et la contribution de celles-ci aux axes.

Il est normal d’avoir des corrélations entre les variables en tête de puits et celles du séparateur

car la température et la pression varient très peu entre ces deux points.

Fig 6. Poids des variables et de la réponse.

Si l’on applique une PLS 1 sur

la réponse qui nous intéresse, QGaz,

on remarque qu’elle n’est expliquée

seulement qu’à 50% (Fig 6). On peut

également affirmer que les variables

les plus liées à la réponse sont les

pressions en tête de puits et de

séparateur ainsi que la densité et la

quantité de « Gas Lift » injecté. Ceci

en adéquation avec le tableau des corrélations. Ces dernières donnent une indication sur la

mauvaise qualité du modèle. En effet pour les 4 variables, elles varient de 43% à 65% ce qui

reste faible.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 18

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

L’incertitude estimée sur la moyenne confirme ces mauvais résultats avec une

approche à ± 184%

Cette mauvaise explication de la variabilité des X et des Y va nous amener à opérer par

groupes. Dans ce sens l’analyse préliminaire sera très utile.

b) Durée de test > 0.5 jour

Si l’on définit par une lettre les 2 types de tests (A < 0.5 jour, B > ou = 0.5 jour) et que

l’on regarde la répartition des puits suivant la durée des tests (Fig 7), on s’aperçoit qu’il existe

effectivement 2 groupes de puits à traiter séparément. Les tests étant les plus stables dans

le cas B, considérons une PLS avec une durée supérieure à une demi-journée. Ce qui

représente seulement 1/10 des données.

Fig 7. Graphique des scores : séparation en fonction de la durée de test.

En traitant les données par cet aspect, le modèle n’est pas meilleur. Seulement 50% de

la variance des X et 54% de celle de Qgaz sont expliquées.

On peut expliquer ceci par l’ACP réalisée sur l’ensemble des données. Si l’on regarde le

graphique des « loadings » (Fig 5 et 6) on remarque que la variable « Durée » contribue très

peu aux axes 1 et 2 et est donc susceptible d’apporter peu d’informations.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 19

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

c) Puits à gaz De la même manière si l’on code les puits à gaz et puits à l’huile sur l’évolution du

G.O.R (cf analyse préliminaire) et sur les informations reçues par la filiale du Cameroun, on

a A qui correspond aux puits dits « à huile » et B les puits dits « à gaz » (Fig 8).

2 groupes se distinguent en fonction de la composante 5 auquel contribuent P inj et Pres, qui

sont deux types de pression renseignant sur le « Gas Lift ».

Fig 8. Variance expliquée et séparation des données sur la base du G.O.R.

Si l’on fait une PLS avec les puits à gaz sur la réponse « Qgaz », le modèle obtenu est

également très peu satisfaisant.

La mauvaise qualité du modèle ne permet pas d’avoir la meilleure estimation possible

de la quantité de gaz et nous amène à se poser différentes questions sur l’utilisation des

variables. Certaines d’entre elles sont ajustables, d’autres sont mesurées (PTH, T sep, Psep...).

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 20

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Doivent-elles être considérées comme des variables ou des réponses ? Les débits étant

normalisés (ramenés en valeurs journalières), est-il utile d’utiliser la durée des tests dans le

modèle ? La variable « Date » est-elle assimilée à un variable continue?

En effet cette approche dite « multivariée » nécessite d’avoir une meilleure

connaissance des paramètres. Les variables présentes ne peuvent, à elles seules, expliquer le

modèle. Ce type d’analyse se rapproche de la méthode d’estimation de l’incertitude de type B

pour laquelle il est impératif de maîtriser chaque étape du processus.

4. Conclusion ACP/PLS

Cette méthode ne s’avère pas concluante, en effet trop de variables sont peu corrélées

(9 composantes pour l’ACP) ce qui rend l’ACP peu intéressante (pas de gain d’information).Il

y a également un manque évident d’information (de bonne qualité) ce qui explique le faible

pourcentage d’explication de la réponse (51%).

La constitution de groupes (durée de tests) nous amène à éliminer trop d’échantillons,

il est donc nécessaire d’homogénéiser la durée de tests (>12h).

Un autre point négatif est l’estimation de l’incertitude sur une MOYENNE, d’une part, et sa

valeur trop élevée (184%), d’autre part.

Contrairement à ce que l’on pensait au départ le problème semble beaucoup plus

difficile et la méthode est inadaptée

Cette conclusion nous amène à explorer des techniques différentes pour analyser ces

données qui vont me permettre d’accomplir ma mission principale : « estimation de

l’incertitude sur le gaz produit global ».

La rencontre du personnel de TOTAL à Pau et notamment de Jean Paul Valois (Analyses

statistiques – Valorisation des gisements) m’a permis de considérer une nouvelle approche et

d’utiliser une méthode régression sur une courbe en fonction du temps. (Régression LOESS)

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 21

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

B. Régression de LOESS : méthode des moyennes mobiles

Cette méthode consistera à estimer une incertitude de type A, issue de calculs statistiques.

1. Principe Le lissage LOESS (ou LOWESS selon la littérature) est une méthode de lissage des

données (couples de données x-y). Un modèle de régression local ajuste chaque point et les

points proches de celui-ci (moyenne mobile). La méthode est aussi parfois appelée régression

robuste localement pondérée. Les données lissées présentent habituellement une image plus

claire de la forme générale de la relation entre les variables x et y. Cette méthode combine la

simplicité de la régression linéaire et la flexibilité d’une régression non-linéaire. La méthode

LOESS a été proposée par W.S Cleveland en 1979 [5] et a été développé par Cleveland et

Devlin (1988) [6].

• Avantages : Cette méthode n’exige pas d’adapter un modèle à toutes les données

de l’échantillon mais nécessite juste d’entrer les paramètres de lissage et le degré

du polynôme.

LOESS est également très flexible, idéale pour des processus complexes pour

lesquels il n’existe pas de modèle théorique.

• Inconvénients : LOESS exige d’avoir un nombre important de données. La

fonction produite est difficilement représentable par une formule mathématique, ce

qui empêche d’être transférable d’une analyse à une autre.

2. Exemple général Une des méthodes peut être d’appliquer un lissage sur une courbe Qgas = f (time) sur un

période donnée avec une fenêtre de lissage, un pas et un degré de polynôme défini

arbitrairement. Grâce au critère de sélection AICc¹ et aux paramètres contrôlés, le

programme va tracer une prédiction dans le temps de la variable Qgas ainsi qu’un intervalle

de confiance à 95%. Le programme donne également les paramètres de lissage qui

conviennent le mieux. Pour une analyse plus personnelle, il est possible de le faire

manuellement. (Fig 9).

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 22

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Fig 12. Récapitulatif de la régression LOESS sur le puits ACM013.

Fig 9. Exemple de régression sur un puits.

- UpperCL et LowerCL sont les intervalles de confiance.

- DepVar est la variable Qgaz d’origine.

- Pred est la variable prédite après lissage.

Exemple : Pour le puits ACM013 le meilleur paramètre de lissage est 0.2. Il est possible

d’affiner l’analyse en réduisant la fenêtre de lissage autour de 0.2.

Ce graphique, accompagné des données numériques, permet de déterminer un intervalle

de confiance à 95% pour chaque test.

Ainsi on peut estimer une incertitude associé au bilan gaz puits par puits, soit à une date donnée soit sur une période définie, ceci en vue d’obtenir un intervalle de confiance sur le champ.

3. Statistiques descriptives

Auparavant il est important, dans le cadre d’une régression, d’observer le comportement des puits en fonction du temps. Pour cela j’ai utilisé STATISTICA et l’ANOVA de Kruskal-Wallis qui est une alternative au test d'Analyse de la variance Inter-groupes. Par cette méthode on pourra déterminer si la production est indépendante d’un puits à un autre.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 23

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Ce test est utilisé pour comparer au moins trois échantillons, et tester l'hypothèse nulle

suivant laquelle les différents échantillons à comparer sont issus de la même distribution ou de distributions de même médiane. Ainsi, l'interprétation du test de Kruskal-Wallis est très similaire à une ANOVA paramétrique d'ordre Un, sauf qu'il est basé sur les rangs au lieu des moyennes.

Le principe est de ranger toutes les observations par ordre croissant en fonction du

débit de gaz. A chacune de ces observations est attribuée un rang (les tests avec grand débit de gaz auront des rangs faibles et réciproquement) On calcule (la somme des rangs dans chaque puits) et R (la somme globale des rangs).

iR

Afin de voir si l’hypothèse nulle ( ) est acceptée ou refusée, le H de Howell est calculé :

0H

V.O = Valeur observée N = nombre total d’observations k = nombre de groupes

in = nombre d’observations dans le groupe n°i = somme des rangs dans le groupe n°i iR

R = somme globale de tous les rangs t = effectif des rangs donnant lieu à des ex-aequo

Dans le cas de notre étude, nous voulons voir comment se comportent les puits entre eux, ainsi la variable dépendante est « Qgaz » et la variable de classement sera « puits ».

0H : Les médianes de la variable « Qgaz » dans les 85 niveaux de la variable « puits » sont égales. Si est vraie, cela signifie que les rangs sont répartis de façons équivalentes pour les 85 puits. Les rangs moyens des différents puits seraient, plus ou moins, les mêmes que le rang moyen global et la dispersion serait faible. Au contraire, si est fausse, certains puits auraient plus de rangs élevés que d’autres et la dispersion serait plus grande. On devrait donc avoir un H de Howell grand et dans ce cas on rejette .

0H

0H

0H

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 24

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Fig 10. ANOVA de Kruskal-Wallis.

Fig 11. Tests de la médiane.

Le test de Kruskal-Wallis (Fig 10) est très significatif (p = 0,000). On peut donc en conclure avec 5% de chance de se tromper, que les performances des différents puits ont été significativement différentes d'un puits à l'autre (en admettant que l’hypothèse nulle est que tous les puits ont la même performance de production).

Le test de la médiane (Fig 11) est plus "brut" et moins sensible que l'ANOVA de Kruskal-Wallis. La feuille de données affiche le nombre d'observations (tests) dans chaque puits qui tombe en dessous (ou est égal à) la médiane commune et le nombre d'observations qui tombe au-delà de la médiane commune. Si un puits possède un plus grand nombre de tests au dessus de la médiane, cela signifie que le puits a une meilleure performance et réciproquement. Si le nombre total de tests en dessus et en dessous de la médiane (50% - 50%) alors la performance des puits est indépendante d’un puits à un autre.

Si H > Chi-Deux (H observé) alors les performances des puits sont significativement différentes. Il est intéressant de montrer, sachant que les puits sont issus d’un même réservoir, que la production d’un puits n’a pas d’influence sur un autre.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 25

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

4. Analyse de la régression LOESS sous SAS La rencontre, chez TOTAL, d’un statisticien (Jean Paul Valois) au sein du Département

« Valorisation des gisements » à Pau, m’a permis de découvrir de nouveaux outils et d’avoir

une nouvelle vision sur la manière de traiter la mission.

En effet, au cours des visites, nous avons exploré cette méthode de lissage permettant

d’obtenir une valeur prédite avec un intervalle de confiance à 95% à un instant donné.

Cette approche a été réalisée grâce aux modules « Magellan » et « Wellfare » qui ont été

développés par J-P. Valois dans un environnement SAS. Ces deux modules permettent de

trier les données et de les traiter par différentes méthodes statistiques.

a) Méthode

L’utilisation de SAS implique de maîtriser le langage de programmation. Quelques

bases m’ont été transmises lors de mes voyages à Pau. Ceci m’a permis d’utiliser, avec l’aide

de J-P Valois, des programmes servant à sélectionner des groupes de données, effectuer des

opérations sur les variables (Annexe 3) mais aussi d’appliquer la régression sur un ensemble

de tests définis.

La méthodologie est la suivante :

• Sommer les débits de gaz pour fournir un débit champ à chaque date.

• Cumuler les débits de gaz depuis le début des tests sur tout le champ.

• Obtenir par régression LOESS un intervalle de confiance à 95% pour une date

donnée.

Cependant ce genre de technique est soumis à différents problèmes :

• Les données de tests sont issues mais au travers de discussion il a été établi que ces

tests étaient très peu représentatifs des données de production.

• Les durées de tests sont effectuées à intervalles irréguliers. Certains tests sont faits

avec une semaine d’écart, d’autres avec trois mois.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 26

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

L’une des solutions pour résoudre le problème est d’interpoler, c'est-à-dire de fabriquer

une nouvelle information. Ceci est possible sous SAS avec la procédure TRANSREG.

b) Interpolation L’idée est de fabriquer une nouvelle information à chaque date (mois, semaine,

jour …) pour chaque puits. Si c’est nouvelles données sont transférables à celles d’origine, on

y appliquera la régression de LOESS afin d’obtenir un intervalle de confiance à 95% sur le

champ.

Valeur observée (après lissage)

Valeur obtenue par interpolation

Fig 12. Comparaison valeurs interpolées / valeurs observées.

Le graphique ci-dessus (Fig 12) nous montre, sur un exemple, que la méthode est

parfaitement valide.

Les valeurs observées après lissage sont en rouge et les valeurs interpolées en rose.

Il y a une très bonne superposition des données, on pourra donc utiliser cette nouvelle

information avec la régression.

c) Applications • Au champ

Ces nouvelles données sont donc sommées par date sur le champ et sont traitées avec la

régression LOESS.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 27

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Fig 13.Production champ à une date donnée.

Sur ce premier graphique (Fig 13), nous observons la quantité de gaz produit sur le

champ à chaque date avec un intervalle de confiance à 95%. Cette quantité est prédite par la

régression.

Mais ce qui se révèle le plus important est le graphique suivant (Fig 14) représentant

les tests cumulés sur tout le champ sur la période globale avec un intervalle de confiance à

95%.

± 5%

Fig 14. Quantité globale de gaz produite depuis le début du test sur le champ.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 28

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Ainsi on peut visualiser à une date donnée, la quantité de gaz produit depuis le début

des tests.

Les résultats semblent très prometteurs puisque l’on approche, à la fin 2006, une

incertitude de ± 5 % sur le champ.

• Aux puits

Avec plus de temps il serait possible de déterminer une incertitude puits par puits en

intégrant l’incertitude expérimentale. En faisant la régression sur chaque puits, on obtient une

valeur prédite pour chaque test entachée d’un écart type.

Si l’on regarde pour un puits donné, l’évolution des écarts types (Fig 14), on observe

une tendance en forme de « U » avec des valeurs élevées en début et fin de la période de test.

Fig 14. Évolution des écarts types sur un puits donné.

Pour avoir une seule valeur par puits valables pour toutes les dates, il suffit de faire la

médiane sur ces valeurs. Et par une méthode analytique (somme des écarts types au carré σ²)

(cf propagation des incertitudes II.C.3), on va pouvoir obtenir une valeur sur puits avec une

incertitude.

5. Conclusions régression LOESS

Cette méthode semble donc plus appropriée avec un atout majeur : La fabrication d’une nouvelle information. Ceci permet d’avoir une information plus cohérente et plus facile à utiliser et présente une voie très intéressante dans le cadre du Reporting Environnement.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 29

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

La régression de LOESS est très prometteuse et nous offre une incertitude sur la

totalité du gaz produit sur le champ depuis le début des tests de 5%. Cette méthode couplée à une méthode analytique (somme des σ²) permettrait de donner un intervalle de confiance par puits. C’est donc une voie très encourageante et à suivre si la mission est poursuivie.

IV. Conclusion

Le problème s’est avéré beaucoup plus difficile que prévue initialement. Le but de

départ était d’utiliser des méthodes classiques ACP / PLS sur les données du Cameroun afin

d’acquérir de l’expérience et ensuite l’adapter à d’autres filiales. Or la technique s’est montrée

totalement inadaptée pour plusieurs raisons :

• La présence de variables non corrélées ne permet pas à l’Analyse en Composantes

Principales d’être efficace : Pas de gain d’information,

• Un manque évident d’informations tant en qualité qu’en quantité (plus de variables

explicatives, moins de valeurs manquantes), ne permet pas d’expliquer correctement la

réponse « Qgaz »,

• La constitution de groupes (cas des durées de tests) nous oblige à éliminer trop

d’échantillons. Une homogénéisation des tests sur une durée supérieure à 12h peut être

utile,

• Dernier point négatif, on obtient par cette méthode une incertitude sur une moyenne (et

non sur une mesure globale) beaucoup trop importante (± 184%).

Cet échec a permis d’explorer une autre voie d’analyse beaucoup plus prometteuse et

appropriée : La régression LOESS.

En effet cette technique intègre une voie d’ « interpolation » qui est une solution aux

données de tests irrégulières et qui permet d’obtenir une information beaucoup plus

cohérente.

La régression de LOESS est une voie à utiliser couplée à une démarche analytique (somme

des σ²) permettant d’avoir une incertitude sur le gaz produit par un puits.

C’est donc une méthode que je recommande de poursuivre.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 30

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

V. Recommandations Dans un premier temps au niveau des essais de puits :

• Il faut plus d’information de meilleure qualité (moins de données manquantes, plus de

variables explicatives),

• Faire, dans la mesure du possible, des tests homogènes supérieures à 12h,

• Il vaut mieux avoir peu de bons essais plutôt que beaucoup inutilisables.

Dans un second temps au niveau du Reporting Environnement :

• Développer l’approche d’interpolation afin d’avoir des données à date fixe et des

données plus homogènes et cohérentes,

• Poursuivre la régression LOESS pour améliorer le Reporting. Si l’on compare les

erreurs de chaque méthode, la régression LOESS (incertitude de ± 5%) est beaucoup

plus performante que la méthode classique (incertitude de ± 184%),

• Parcourir des méthodes expérimentales comme la somme des σ², prenant en compte

l’erreur aléatoire, ou la quantification des erreurs de mesures mais c’est une méthode

beaucoup plus difficile à mettre en place car elle prend du temps et elle nécessite de

bien connaître le processus.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 31

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

GLOSSAIRE

Gas cap : Dans un gisement, gaz libre, séparé du pétrole et rassemblé au voisinage du

sommet de la structure

Gas coning : Soulèvement, en forme de cône, au niveau de l'extrémité inférieure d'un

puits, de la nappe sous-jacente à un gisement de gaz ou d'huile, provoqué par une

extraction trop rapide du gaz ou de l'huile.

Gas Lift : gaz injecté dans la colonne d’huile afin de l’alléger et d’améliorer la

production.

Rs : Le rapport de la somme des volumes de gaz, libéré ramenés aux conditions standard

sur le volume de liquide aux conditions standard. Les fluides sont ramenés aux conditions

standard par un process. Le Rs est associé à un chemin thermodynamique.

Pression de saturation (Psat) : Également appelée pression de bulle, pression à partir de

laquelle l’huile va se mettre à dégazer dans le gisement.

Critère AICc : Le critère d'Akaike (AIC pour An Information Criterion) est défini dans le

cas général par la formule suivante : AIC = 2k - 2ln (L).

Où k est le nombre de paramètres et L la fonction de probabilité.

On suppose que les erreurs du modèle sont normalement et indépendamment distribuées.

Alors pour n étant le nombre d'observations et RSS la somme des écarts au carré, AIC

devient : AIC = 2k - n.ln(RSS/n). Plus celui-ci est petit, meilleur il est.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 32

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Annexe 1 : Process Flow Diagram

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 33

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

Annexe 2 : Plan des installations (Rio Del Rey-Cameroun)

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 34

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

ANNEXE 3 : Régression LOESS sur le puits ACM013.

Triage et sélection des puits.

Nom des données de sortie

Procédure de régression avec choix des paramètres à

appliquer.

Tracé du graphique

Calcul de l’incertitude relative

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 35

Estimation de l’incertitude sur le gaz produit global du champ Rio Del Rey (Cameroun)

BIBLIOGRAPHIE

[1] Hotteling H. (1933) – Analysis of a complex of statistical variables into principal

components.

The journal of educational psychology, vol. 24, p. 417-441 et 498-520. JFM 5901183.01

[2] Wold H. (1966) – Estimation of principal components and related models by iterative

least squares,

Multivariate Analysis, Krishnaiah, P.R. (Ed), Academic Press, New York, p. 391-420.

[3] Shapiro S., Wilk M. B., Chen H. J. (1968) - A Comparative Study of Various Tests for

Normality,

Journal of the American Statistical Association, Vol. 63, No. 324 (Dec., 1968), p. 1343-1372

[4] Pearson K. (1901) – On lines and planes of closest fit to systems of points in space.

Phil. Mag, n°2 (6 ème série), p. 559 -572.

[5] Cleveland W.S. (1979) - Robust Locally Weighted Regression and Smoothing

Scatterplots, Journal of the American Statistical Association, Vol. 74, pp. 829-836.

[6] Cleveland W.S. and Devlin S.J. (1988) - Locally Weighted Regression: An Approach to

Regression Analysis by Local Fitting,

Journal of the American Statistical Association, Vol. 83, pp. 596-610.

Cédric Lacour (Mars – Août 2007) ¹ Voir définition dans le glossaire 36

Recommended