19
1 Un nouveau modèle statistique pour Un nouveau modèle statistique pour l’évaluation de l’abondance en l’évaluation de l’abondance en espèces marines espèces marines à partir de données géo-référencées à partir de données géo-référencées zero-inflated zero-inflated Application à des données de relevés Application à des données de relevés au chalut de fond au chalut de fond Sophie Ancelet 1 , Marie-Pierre Etienne 1 , Hugues Benoît 2 , Eric Parent 1 1 AgroParisTech/ENGREF, équipe MORSE, Paris 2 Fisheries and Oceans Canada, Gulf Fisheries Centre, Moncton Forum Halieumétrique, La Rochelle , 21 Juin 2007

1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

Embed Size (px)

Citation preview

Page 1: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

1

Un nouveau modèle statistique pour Un nouveau modèle statistique pour l’évaluation de l’abondance en espèces l’évaluation de l’abondance en espèces

marines marines à partir de données géo-référencées à partir de données géo-référencées

zero-inflatedzero-inflatedApplication à des données de relevés Application à des données de relevés

au chalut de fondau chalut de fondSophie Ancelet 1, Marie-Pierre Etienne 1 , Hugues Benoît 2, Eric Parent1

1 AgroParisTech/ENGREF, équipe MORSE, Paris2 Fisheries and Oceans Canada, Gulf Fisheries Centre, Moncton

8ème Forum Halieumétrique, La Rochelle , 21 Juin 2007

Page 2: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

2

pêche commerciale massive au chalut et à la senne

surexploitation Constat: diminution inquiétantes des ressources halieutiques

Contexte Contexte

Page 3: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

3

Misant sur le fait que plusieurs espèces Misant sur le fait que plusieurs espèces d’invertébrés marins d’invertébrés marins ont une mobilité restreinte au stage adulte, ont une mobilité restreinte au stage adulte, essayer de dissocier les impacts directs et essayer de dissocier les impacts directs et indirects indirects de la de la pêche commercialepêche commerciale de la de la prédation prédation des des changements climatiqueschangements climatiques sur les sur les dynamiques spatio-temporellesdynamiques spatio-temporelles..

46°

47°

48°

49°

65° 64° 63° 62° 61° 60° 59°

1986-88

46°

47°

48°

49°1991-92

46°

47°

48°

49°1995-96

65° 64° 63° 62° 61° 60° 59°

46°

47°

48°

49°1999-00

46°

47°

48°

49°

65° 64° 63° 62° 61° 60° 59°

1989-90

46°

47°

48°

49°1993-94

46°

47°

48°

49°1997-98

65° 64° 63° 62° 61° 60° 59°

46°

47°

48°

49°2001-02

10

50

250

1000

2000

hours /

Otb for Jan-Dec

1997-1998

46°

47°

48°

49°

66° 65° 64° 63° 62° 61° 60°

1999-2000

46°

47°

48°

49°

2001-2002

66° 65° 64° 63° 62° 61° 60°

46°

47°

48°

49°

46°

47°

48°

49°

66° 65° 64° 63° 62° 61° 60° 59°

46°

47°

48°

49°

66° 65° 64° 63° 62° 61° 60° 59°

46°

47°

48°

49°

Crab survey (Jul-Aug) Sept. bottom-trawl survey

Comment dissocier les effets Comment dissocier les effets des impacts que l’on peut et ne des impacts que l’on peut et ne

peut pas contrôler ?peut pas contrôler ?

Page 4: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

4

6 6 6 5 6 4 6 3 6 2 6 1 6 0

4 6

4 7

4 8

4 9

4 6

4 7

4 8

4 9

6 6 6 5 6 4 6 3 6 2 6 1 6 0

415

416

417

418

419

420

421

422 423

424

425426

427

428

429431

432

433

434

435

436

437

439

402

403

Tous les mois de septembre depuis 1971 65-200 traits de chalut standards par année Relevés aléatoires stratifiés Trait standard ciblé: 30min à 3.5 nœuds Biomasses en kg/trait pour 14 espèces d’invertébrés épibenthiques.

Les donnéesLes données

Page 5: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

5

Un exemple typique de Un exemple typique de données données

zero-inflatedzero-inflated

Histogramme des biomasses en oursins recueillies entre 1999 et 2001

Impossibilité d’utiliser les lois de probabilité standard

Comment analyser et cartographier l’abondance en oursins à partir de telles données?

Strongylocentrotus sp.

Biomass in kg

Page 6: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

6

Approche classique: Approche classique: le modèle Delta-Gammale modèle Delta-Gamma

Modèle de mélange à 2 composantes ( two-parts model)

k=1,2,.,r

Pas de propriété d’additivité

Modèle spécifié pour des données préalablement standardiséesSur-estimation ou sous-estimation de la probabilité d’absence

Page 7: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

7

Dans une strate ….. Nk = Nombre aléatoire de « gisements » collectés sur une surface chalutée Sk

NNkk | | , S, Skk ~ Poisson( ~ Poisson(××(S(Skk/d))/d))

Chaque « gisement » contient une quantité aléatoire inconnue de biomasse Xk,j j=1,…,Nk

Si Nk=0, aucun « gisement » ramassé :

Si Nk>0, au moins un « gisement » ramassé :

XXk,jk,j | | ~ ~iidiid Exp( Exp())

S k

Alternative: utiliser un Alternative: utiliser un processus de Poisson composé processus de Poisson composé

(la loi des fuites)(la loi des fuites)

Page 8: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

8

La probabilité d’absence décroît avec la distance chalutéeLa probabilité d’absence décroît avec la distance chalutée

P(YP(Ykk=0)= P(N=0)= P(Nkk=0)= exp(-=0)= exp(-××SSkk/d) /d)

Propriété d’additivité vérifiée:

Les avantages du modèleLes avantages du modèle

Modèle conceptuel, parcimonieux (2 paramètres et )

Le modèle permet de traiter directement des données brutes !

Page 9: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

9

Variabilité intra-strateVariabilité intra-strate

-66 -65 -64 -63 -62 -61 -60

4546

4748

4950

Longitude

Latit

ude

Découpage de l’hétérogénéité spatiale: 38 strates

Dans chaque strate i : Les observations sont Les observations sont identiquement identiquement distribuées:distribuées: un jeu de un jeu de paramètres par strate paramètres par strate ((ii,,ii))

Les observations sont Les observations sont indépendantesindépendantes : :

YYi,ki,k ~ Fuite( ~ Fuite(ii,,ii) )

Page 10: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

10

Loi des fuites appliquée indépendamment dans chaque strate

Faiblesse: mauvaise qualité de l’estimation dans les petites strates

Version 1: Modèle (LOL)Version 1: Modèle (LOL)*38*38

-66 -65 -64 -63 -62 -61 -60

4546

4748

4950

Longitude

Latit

ude

Page 11: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

11

-66 -65 -64 -63 -62 -61 -60

4546

4748

4950

Longitude

Latit

ude

Hypothèse: comportement similaire entre toutes les strates

Tirer profit de l’information disponible dans toutes les strates du Golfe modélisation de la variabilité entre les strates

Relier les strates via une distribution régionale commune

distribution régionale commune

i ~iid Gamma(a,b)i~iid Gamma(c,d)

Version 2: Modèle RVersion 2: Modèle R,,-LOL-LOL

Page 12: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

12

Et s’il existait une structure Et s’il existait une structure spatiale spatiale

entre strates voisines?entre strates voisines?

Répartition spatiale des oursins en 1999-2000-2001

Page 13: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

13

Tendance Variabilité spatialiséeModèle CAR Gaussien Intrinsèque

Bruit résiduelnon spatialisé

i = pour tout i=1,2,…,38

Log(i)= m0 + Ψi + εi

Version 3: Modèle IARVersion 3: Modèle IAR-LOL-LOL

ni= nombre de strates voisines de la strate i

Page 14: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

14Yi,k

Ni,k

μii=

Ob

serv

ati

on

s

Si,k

Un modèle hiérarchique à 3 Un modèle hiérarchique à 3 niveauxniveaux

m0 IAR ε

0 5 10 150

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

prior

[ ]

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

prior

[]

Pri

or

s 0 5 10 150

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

prior

[ ]

Inférence Bayésienne:Algorithmes MCMC

Pro

cess

us

Sp

ati

al

mu[30] sample: 6000

mu[30]

-0.2 0.0 0.2 0.4 0.6

P(m

u[30

])0.

020

.0Obtention de lois a posteriori pour tous les paramètres et variables latentes

Page 15: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

15

Ajustements comparés de 8 Ajustements comparés de 8 modèlesmodèles

Données d’ajustement: Oursins (1999-2000-2001)Critère: Facteurs de Bayes + DIC

Page 16: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

16

Moyenne a posteriori des i

Résultats d’inférence: Résultats d’inférence: IARIAR-LOL-LOL

Difficultés du IAR ?

Répartition spatiale des oursins 1999-2000-2001

Page 17: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

17

Prédictions comparées de 8 Prédictions comparées de 8 modèlesmodèles

Données prédites: oursins 2002Critère: Posterior Predictive Loss Criterion (PPLC) moyens calculés à partir de 100 échantillons prédictifs de 2000 valeurs

Page 18: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

18

La standardisation de La standardisation de données données

zero-inflated: une source de zero-inflated: une source de biaisbiaisDistance standard= 0.5 Distance standard= 1.75

Distance standard= 3

Fu

ite

Fu

ite

Fu

ite

Delta-Gamma

Delta-Gamma

Delta-Gamma

Page 19: 1 Un nouveau modèle statistique pour lévaluation de labondance en espèces marines à partir de données géo-référencées zero-inflated Application à des données

19

Conclusions & Conclusions & PerspectivesPerspectives

Loi des fuites = solution aux problèmes liés à la non-Loi des fuites = solution aux problèmes liés à la non-additivité des modèles Deltaadditivité des modèles Delta

La prise en compte de la structure spatiale de La prise en compte de la structure spatiale de données d’abondance permet d’améliorer les données d’abondance permet d’améliorer les prédictions prédictions

Construction d’un modèle hiérarchique spatio-Construction d’un modèle hiérarchique spatio-temporel couplant un modèle de dynamique des temporel couplant un modèle de dynamique des populations à un modèle géostatistique. populations à un modèle géostatistique. en cours.en cours.

Modelling spatial zero-inflated continuous data with Modelling spatial zero-inflated continuous data with an exponentially compound Poisson process. an exponentially compound Poisson process. Environmental and Ecological StatisticsEnvironmental and Ecological Statistics

S.Ancelet, M.P.Etienne, H.P.Benoît, E.Parent. (Article soumis)S.Ancelet, M.P.Etienne, H.P.Benoît, E.Parent. (Article soumis)