20
Reçu: décembre 2012 ; Accepté: avril 2013 étude et Gestion des Sols, Volume 20, 1, 2013 - pages 27 à 46 Cartographie numérique d’une carte pédologique au 1/50 000 dans le Doubs, France 27 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays INRA, US 1106 INFOSOL, F-45075 Orléans, France *: Auteur correspondant: [email protected] RÉSUMÉ Le développement récent des outils de segmentation d’image et de classification par des arbres de régression boostés offre de nouvelles perspectives pour la cartographie numérique prédictive des sols. L’accès à un grand nombre d’observations pédologiques via la base de données Donesol couplé à celui des données environnementales facilement accessibles (MNT et ses dérivées, carte géologique, carte d’occupation du sol) nous permet de produire une carte prédictive des sols avec une résolution de l’ordre du 1/50 000, validée par des observations ponctuelles. Sur le secteur de Vercel (Jura, France), la démarche originale présentée ici a permis de cartographier une zone dont ¼ seulement de la surface avait fait l'objet d'une cartographie avec des méthodes classiques de prospection sur le terrain. 2348 observations ponctuelles réparties quant à elles sur la presque totalité du 1/50 000 de Vercel ont permis d’ajuster et de valider le modèle. Nous avons mené deux approches parallèles en prenant comme données de calibration et de validation, d’une part, des données pédo- logiques ponctuelles qui font référence à des types de sols, et, d’autre part, des données pédologiques surfaciques qui font référence à des unités cartographiques de sols (UCS) plus ou moins complexes. Les modèles ont été définis à partir d’un outil disponible sous R faisant appel à des arbres de régressions multiples boostés, MART (Friedmann, 2002). Les cartes de prédiction obtenues ont été lissées avec un filtre majoritaire afin de produire une carte avec des limites d’UCS bien définies. La précision globale des prédictions donne des résultats très satisfaisants au niveau des validations internes (entre 80 et 90 %) pour les deux approches. La validation externe, conduite seulement sur l’approche surfacique avec uniquement des données surfaciques, est comprise entre 40 et 50 % selon l’ajustement. Une carte des incertitudes est également produite avec l’approche surfacique et permet de déterminer les zones où le modèle s’affaiblit. Les données ponctuelles ont alors servi à affiner la faiblesse de la prédiction par une approche d’expertise. La classification produite avec l’approche surfacique montre en effet des UCS bien définies au niveau des zones

Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

  • Upload
    lykhanh

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Reçu : décembre 2012 ; Accepté : avril 2013 étude et Gestion des Sols, Volume 20, 1, 2013 - pages 27 à 46

Cartographie numériqued’une carte pédologique au 1/50 000 dans le Doubs, France

27

S. Lehmann, M. Eimberck, M. P. Martin et D. ArrouaysINRA, US 1106 INFOSOL, F-45075 Orléans, France* : Auteurcorrespondant :[email protected]

RésuméLedéveloppementrécentdesoutilsdesegmentationd’imageetdeclassificationpardesarbresderégressionboostésoffredenouvellesperspectivespourlacartographienumériqueprédictivedessols.L’accèsàungrandnombred’observationspédologiquesvialabasededonnéesDonesolcoupléàceluidesdonnéesenvironnementalesfacilementaccessibles(MNTetsesdérivées,cartegéologique,carted’occupationdusol)nouspermetdeproduireunecarteprédictivedessolsavecunerésolutiondel’ordredu1/50 000,validéepardesobservationsponctuelles.SurlesecteurdeVercel(Jura,France),ladémarcheoriginaleprésentéeiciapermisdecartographierunezonedont¼seulementdelasurfaceavaitfaitl'objetd'unecartographieavecdesméthodesclassiquesdeprospectionsurleterrain.2 348observationsponctuellesrépartiesquantàellessurlapresquetotalitédu1/50 000deVercelontpermisd’ajusteretdevaliderlemodèle.Nousavonsmenédeuxapprochesparallèlesenprenantcommedonnéesdecalibrationetdevalidation,d’unepart,desdonnéespédo-logiquesponctuellesquifontréférenceàdestypesdesols,et,d’autrepart,desdonnéespédologiquessurfaciquesquifontréférenceàdesunitéscartographiquesdesols(UCS)plusoumoinscomplexes.Lesmodèlesontétédéfinisàpartird’unoutildisponiblesousRfaisantappelàdesarbresderégressionsmultiplesboostés,MART(Friedmann,2002).Lescartesdeprédictionobtenuesontétélisséesavecunfiltremajoritaireafindeproduireunecarteavecdeslimitesd’UCSbiendéfinies.Laprécisionglobaledesprédictionsdonnedesrésultatstrèssatisfaisantsauniveaudesvalidationsinternes(entre80et90 %)pourlesdeuxapproches.Lavalidationexterne,conduiteseulementsurl’approchesurfaciqueavecuniquementdesdonnéessurfaciques,estcompriseentre40et50 %selonl’ajustement.Unecartedesincertitudesestégalementproduiteavecl’approchesurfaciqueetpermetdedéterminerleszonesoùlemodèles’affaiblit.Lesdonnéesponctuellesontalorsserviàaffinerlafaiblessedelaprédictionparuneapproched’expertise.Laclassificationproduiteavecl’approchesurfaciquemontreeneffetdesUCSbiendéfiniesauniveaudeszones

Page 2: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

28 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

d’apprentissagemaisrelativementbruitéesauniveaudeszonesvierges.Laclassificationobtenueavecl’approcheponctuelleproduitunrésultattrèspixelliséavecunmélangedeclassesdesolsassezcomplexelocalementmaisbénéficiantd’unebonneprécisionglobaledeclassificationcommeindiquésurlacartedesincertitudes.Enfin,l’expertisedupédologueapermisdesynthétiserles2cartesainsiproduitesafind’obtenirin fineunecartechoroplèthedesunitéscartographiquesdesols.Leslimitesdesunitéscartographiquesontétéobtenuesàpartirdelacarteissuedesdonnéessurfaciques,etleurcontenuestdérivédelacarteissuedesdonnéesponctuelles.Legaindetempsparrapportàuneapprocheconventionnelleestestiméentre70et80jourspour36 000 ha.Maisl’approchenumériqueseulenesuffitpas.Ilresteindispensabledes’approprierleterrainavantlamodélisationetdevalidersesprédictionspardesnouvellesobservations.mots clésCartographienumériquedessols,cartographieprédictivedessols,arbrederégressionsmultiplesboostés,analysedemodèlenumé-riquedeterrainmulti-échelle,matricedeconfusion.

Summary Digital Soil mapping of a Soil claSSeS map at 1:50,000 Scale in the DoubS Department, franceRecent advances in segmentation processing and in classification using boosted regression trees enables new prospects for pre-dictive digital soil mapping. The availability of numerous soil data through the French soil database Donesol, and to easy to access environmental co-variates (DEM and derivatives, geological maps, land cover maps…) enables to produce a predicted soil type map, at a scale of about 1:50,000, validated by point data in the area of Vercel (Jura, France). On this area, the approach we detail here led to mapping a surface ¼ of which only was previously mapped. 2 348 point data scattered over the whole territory were used to calibrate and validate the model. Firstly, we produced a predictive map from point data. Half of these data was used to calibrate a model using boosted regression trees. The remaining half was used for validation. We tested 8 iterations using data integrating more and more large spatial domains. The derivates from the DEM were averaged using circular windows of growing size (diameters from 30 to 1 800 m). The resulting map was affected by some noise that we removed using a filter based on the dominant classes in order to obtain a map with clear abrupt limits. Secondly, we used the same approach taking as calibration data the soil units (using a buffer around the limits in order to get “pure” pixels).Lastly the soil surveyor expertise was used to produce a synthesis of these two predictions to obtain a chloropleth map of soil units. The time saved by this approach in comparison to a classical one is estimated to be about 70-80 days for 36,000 ha. DSM alone is not self-sufficient, knowledge of the terrain and external validation remain essential.Key-wordsDigital soil mapping, predictive soil mapping, boosted classification tree, multi-scale digital terrain analysis, confusion matrix.

reSumen cartografía numérica De un mapa peDológico al 1/50 000 en el DoubS, franciaEl desarrollo reciente de herramientas de segmentación de imagen y de clasificación por arboles de regresión con "boosting" ofrece nuevas perspectivas para la cartografía numérica predictiva de los suelos. El acceso a un gran número de observaciones pedológicas vía la base de datos Donesol acoplado a los de los datos ambientales fácilmente accesibles (MNT y sus derivadas, mapa geológico, mapa de uso del suelo) nos permite producir un mapa predictivo de suelos con una resolución del orden del 1/50 000, validado por observaciones puntuales. En el sector de Vercel (Jura, Francia), el enfoque original presentado aquí permitió cartografiar una zona cuya solamente ¼ de la superficie había hecho objeto de una cartografía con métodos clásicos de prospección en el terreno. 2348 observa-ciones puntuales repartidas sobre la casi totalidad del 1/50 000 de Vercel permitieron ajustar y validar el modelo.Conducimos dos enfoques paralelos tomando como datos de calibración y de validación, de una parte datos pedológicos puntuales que hacen referencia a tipos de suelos, y, de otra parte datos pedológicos surfacicos que hacen referencia a unidades cartográficas de suelos (UCS) más o menos complejas. Se definieron los modelos a partir de un herramienta disponible bajo R que utiliza arboles de regresiones múltiples con "boosting", MART (Friedmann, 2002). Los mapas de predicción obtenidos fueron suavizados con un filtro mayoritario a fin de producir un mapa con límites de UCS bien definidos.La precisión global de las predicciones da resultados muy satisfactorios al nivel de las validaciones internas (entre 80 y 90%) para los dos enfoques. La validación externa, conducida solamente sobre el enfoque surfacico con únicamente datos surfacicos, está compren-

Page 3: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 29

Etude et Gestion des Sols, 20, 1, 2013

Danslecontexteactueldedisponibilitédesdonnéesgéographiquesnumériques,ilestdésormaispossibled’avoirfacilementaccèsàdenombreuxparamètres

environnementauxcommelereliefàl’échellemondiale(modèlenumériqued’élévationASTERaupasde30 m),l’occupationdusolàl’échelleeuropéenne,oulagéologieavecleportailInfoterreduBRGM.LadirectiveeuropéenneInspiredonneparailleursuncoupd’accélérateurpourrecenseretdonneraccèsàtouteslesdonnées environnementales notamment pour les organismesderecherchepublique.

En France, la disponibilité des données pédologiquesnumériques est centralisée au niveau de l’unité INRA InfoSol(Orléans) qui coordonne la mise en œuvre des RéférentielsRégionaux Pédologiques (cartes au 1/250 000) et des cartespédologiques à des échelles plus fines, principalement au1/100  000. InfoSol administre également la base de donnéeDoneSol (Grolleau et al., 2004) qui intègre les donnéessurfaciquesdesRRP1maisaussiplusieursdizainesdemilliersde profils et de sondages issus des études pédologiquesréférencéesàcejour.

Dans un même temps, l’accessibilité aux variablesenvironnementales sur l’ensemble du territoire ainsi que laprésencededonnéespédologiquesfiablesetnormaliséessurdenombreuses régions renddésormaispossible le recoursàdesméthodesdecartographienumérique.Eneffet,lesmodèlesimplicites de distribution spatiale des sols établis par descartographespeuventêtretraduitsetformalisésenutilisantdesrelations avec des variables environnementales (Lagacherie,

1992 ;Lagacherieet al.,1995 ;Buiet al.,1999 ;McKenzieandRyan, 1999 ; Moran and Bui, 2002 ; Bui and Moran, 2003 ;Lehmann et al.,2007 ;Walteret al.,2007 ;Grinandet al.,2008 ;Laroche et al.,2011 ;Lemercieret al.,2012).LesrelationsentrelesoletlesfacteursenvironnementauxontétéconceptualiséesetformaliséesparMacBratneyet al.(2003)àtraverslemodèlescorpanquifaitréférenceà7facteursdeformationdessols :-s :lesol,décritcommeteloucertainesdesespropriétésen

unpointdonné,-c :lespropriétésclimatiquesdel’environnementenunpoint

donné,-o :lesorganismes,lavégétation,lafauneoul’activitéhumaine,-r :lereliefoulatopographie,-p :lematériauparentaloulalithologie,-a :l’âgeoulefacteurtemporel,-n :lapositiondansl’espace.

Cemodèleconceptuelestlargementutilisépourprédiredestypesdesols,despropriétésoudesfonctionsdusolenprenantencompte les facteursde lapédogenèseet leurs interactions(Walteret al.,2006 ;Mendonça-Santos,2006 ;DobosetHengl,2009).

Les techniques de prédiction des propriétés du sol oudestypesdesolss’appuientsurdesméthodesd’interpolationspatialecommelesapprochesgéostatistiquesoudesméthodesd’apprentissage automatique. Les techniques d’interpolationspatiale ontmontré d’excellents résultats en cartographie dessols (Bourennane and King, 2003) mais elles requièrent ungrandnombred’observationssurl’ensembledelazoned’étude.L’apprentissageautomatique (machine-learning) faitappelàunalgorithme qui détermine, ou du moins explicite, les relations

dida entre 40 y 50 % según el ajustamiento. Un mapa de incertidumbres está igualmente producido con el enfoque surfacico y permite determinar las zonas donde el modelo se debilita. Los datos puntuales sirvieron entonces para afinar la debilidad de la predicción con un enfoque de pericia. La clasificación obtenida con el enfoque surfacico muestra en efecto UCS bien definidas al nivel de las zonas de aprendizajes, pero relativamente con ruido de fondo al nivel de las zonas vírgenes. La clasificación obtenida con el enfoque puntual produce un resultado muy pixellizado con una mezcla de clases de suelos bastante compleja localmente pero que beneficia de una buena precisión global de clasificación como indicado en el mapa de incertidumbres.En fin, la pericia del pedólogo permitió sintetizar los 2 mapas así producidos a fin de obtener in fine un mapa coroplético de unidades cartográficas de suelos. Los límites de las unidades cartográficas fueron obtenidos a partir del mapa resultante de los datos surfacicos, y su contenido esta derivado del mapa resultante de los datos puntuales. El ahorro de tiempo en relación con un enfoque convencional está estimado entre 70 y 80 días para 36 000 ha. Pero el enfoque numérico solo no está suficiente. Queda indispensable apropiarse el terreno antes la modelización y validar sus predicciones por nuevas observaciones.palabras claveCartografía numérica de suelos, cartografía predictiva de suelos, árbol de regresiones múltiples con "boosting", análisis de modelo numérico de terreno multiescala, matriz de confusión.

1 : Référentiels Régionaux Pédologiques

Page 4: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

30 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

entre une réponse et ses «  prédicteurs  » dans le cas d’uneapprochesupervisée(Odehet al.,1992).

Les méthodes de classification supervisée ont pourobjectif d’extraire un modèle d’organisation spatiale du sol àpartir d’un jeu de données d’apprentissage, correspondant àdes situations connues. L’extrapolation de ce modèle à dessituations inconnues fournit laprédiction recherchée. Ilsexistede nombreuses méthodes parmi lesquelles nous pouvonsciter : les réseaux de neurones (Boruvka and Penizek, 2006 ;McKenzieandRyan,1999) ;lesmachinesàvecteurdesupport(SVM)encorepeuutiliséesencartographienumériquedessolsbien qu’ayantmontré des résultats très prometteurs (Ballabio,2009) et souvent supérieurs à ceux obtenus avec les réseauxde neurones ; les techniques de partitionnement utilisant unemétriquepourmesurerladistanceentredesclassescommeparexemple ladistancedeManhattanemployéedans l’algorithmedeCLAPAS(Robbez-Masson,1994 ;Lehmannet al.,2007) ;lesarbresdedécisionsquipermettentdereformulerunproblèmecomplexe sous la forme graphique d’un arbre, de façon àfaire apparaître à l’extrémité de chaquebranche les différentsrésultats possibles (classesde sols oupropriétés) en fonctiondesdécisionsprisesàchaqueétape,enfonctiondesfacteursenvironnementaux.Leur lisibilité, leur rapiditéd’exécutionet lepeud’hypothèsesnécessairesa prioriexpliquentleurpopularitéactuelle(Anonyme(29mars2013),« Arbrededécision »,< http://fr.wikipedia.org/wiki/Arbre_de_décision >).

Le «  boosting  » a été appliqué aux arbres de décisionspar Friedman [(2001) d’après Freund et Schapire (1996)] pouraugmenter leur performance. Lors du boosting, un grandnombre d’arbres de classification sont combinés pas à paspour optimiser les performances de la prédiction. Les arbresindividuels sont ajustés petit à petit et de façon itérative surlesdonnéesd’apprentissagepouraugmenter l’importancedesobservationsfaiblementmodéliséesparlescollectionsd’arbresexistantes(Elithet al.,2008).

D’unpointdevuehistorique,lesarbresdedécisionsontd’abordétéemployésenécologieenutilisantdesdonnéesde télédétection (Lees and Ritman, 1991 ; Michaelsen et al., 1994 ; Pal and Mather, 2003 ; Lawrence et al., 2004 ;Moisen et al.,2006 ).Enraisondeleursavantagesetdeleurpotentielpour lamodélisationde la répartitionspatialedessols,lesarbresdedécisionssontdeplusenplusemployéspourprédiredes typesoudesclassesdesols (Scullet al., 2005 ;MinasnyandMcBratney,2007 ;Grinandet al.,2008 ;Lemercier et al.,2012).

InitialementdéveloppésparBreimanet al.(1984),lesmodèlesbasés sur de arbres de décision ont donné naissance à desmodèles aujourd’hui implémentés sous R comme le modèleCART (Classification and Regression Trees) (Friedman, 2002 ;Friedman and Meulman, 2003). Le modèle MART (MultipleAdditive Regression Tree) est une extension du modèle CARTdéveloppée sous R. D’après Friedman et Meulman (2003), les

arbresdedécisionsprésententdenombreuxavantagespour laclassificationsupervisée.Eneffet,ilspeuventtraiterdesdonnéesenentréeden’importequeltype(qualitative,quantitative,binaire,etc.)etde lamêmefaçon. Ilssontnonparamétriques,desortequ’aucunehypothèsen’estrequiseauniveaudeladistributiondesvariablesetqu’iln’estpasnécessairedetransformerlesdonnées.Lesarbresnesontsensiblesniauxvaleursmanquantes,niauxvaleursextrêmes,niauxdonnéessans relationavec lavariableréponse.Lesrelationsentrelesfacteursdéterminantssontprisesencomptesansconnaissancea priori.Cesmodèlesnesontpasnonplussensiblesauxdifférentesunitésdemesuresdesvariablesprédictives.Enfin,lesarbresdedécisionspeuventêtreemployésavecun jeudedonnéesdecalibration relativement limitéet lesrésultatssontassezexplicitesetplusfacilesàinterpréterqueceuxissusdesautresmodèlescitésplushaut.

Le travail présenté ici porte sur un essai de cartographienumérique sur la feuille à 1/50   000 de Vercel (quart Nord-Estdelafeuilleà1/100  000deBesançon).Nousavonsmenédeuxapprochesparallèlesenprenantcommedonnéesdecalibrationet de validation, d’une part, des données pédologiquesponctuelles qui font référence à des types de sols et, d’autrepart,desdonnéespédologiquessurfaciquesquifontréférenceàdesunitéscartographiquesdesolsplusoumoinscomplexes.

Nousavonsainsiemployél’algorithmeMARTpourextrapolerlesobservationsponctuellesetsurfaciquessurl’ensembledelacarte.Nousavonsensuitevalidécesrésultatsparl’expertisedupédologueetenfinlesavonssynthétisés.

matéRiel et méthoDe

Zone d’étudeLazoned’étudecorrespondàlafeuilledeVerceld’aprèsle

découpageau1/50 000desfeuillestopographiquesdel’IGN.ElleestsituéeaucentredudépartementduDoubs(figure 1a) et couvre55 000 ha.Éloignédel’influencerégulatricedel’océan,leclimatduDoubsauneforteinfluencecontinentale  :neigeetfortesgeléesl’hiver,sécheresseetchaleurl’été,ponctuéespardespluiespouvantêtreorageuses.Laprincipaleparticularitédu climat de ce département est sa grande variabilité aussibien au cours d’une saison que d’une année sur l’autre. Lesprécipitationsmoyennessurlacartesontcomprisesentre700et1 300 mmet la températuremoyenneannuelleentre7,9 °Cet 10,2  °C avec une amplitude annuelle maximale pouvantatteindre 50  °C (source :MétéoFrancedepuis 1960). Le ventdominant(27,5 %)estdesecteursud-ouestàsud/sud-ouest,c’est« levent »venudel’Atlantiqueetquiapportelapluie.Unvent secondaire (13  %) souvent intense et desséchant, «  labise »,vientdusecteurnord-est.

La carte de Vercel se situe sur trois plateaux qui formentle flanc ouest du massif du Jura, séparés entre eux par des

Page 5: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 31

Etude et Gestion des Sols, 20, 1, 2013

- lesgrandescultures :peuoupasdecontraintes ;solsprofonds,ousuperficielsnonpierreux,oufaiblementhydromorphes ;- les prairies de fauche : sols superficiels ou faiblementhydromorphes.

le contexte historiqueLaréalisationdelacartedessolsà1/100 000deBesançona

démarréen1980etfutbrutalementinterrompueparladisparitiondu Professeur Sylvain Bruckert (1993) et la réorganisation duLaboratoire de Pédologie de l’Université de Besançon. A cemoment,3des4coupuresà1/50 000composant la feuilleà1/100 000avaientétéfinalisées :Besançon,OrnansetQuingey.Les levers systématiques sur celle de Vercel étaient réaliséspour2/5desasurface.Afindesauvegarderetdevalorisercetimportant acquis de connaissances, l’Unité InfoSol de l’INRAa décidé, dans le cadre de son programme ConnaissancePédologiquedelaFrance,definalisercetravaild’inventaire,encomplétantlacartedeVercelà1/50 000,puisensynthétisantl’ensembledes4coupuresàl’échelledu1/100 000,enaccordaveclalégendepréparéeparlesauteurs.Danslamesureoùiln’étaitpasenvisagéde réaliseruneprospectionsystématiquedans les secteurs non levés, une méthode de cartographienumérique a été mise en œuvre pour finaliser la cartepédologiqueau1/50 000deVercel.

les données numériques

Les données pédologiquesDeuxtypesdedonnéesétaientdisponibles :uneminute

de carte pédologique au 1/50  000 (levée au 1/25 000)couvrant 2/5 de la surface d’étude ainsi que 2 348 profilset sondages répartis principalement sur la moitié ouestde la carte (figure 1a). Les observations ponctuelles quiont permis d’élaborer cette carte ont été réalisées pardifférents cartographes de l’Université deBesançon. Ellesontétédécritesselonunsystèmedeclassificationmorpho-édaphique élaboré par Bruckert (1987). Dans un premiertemps,levolumeprospectableparlesracinesestdéfiniparl’épaisseurdeterresituéeau-dessusduniveaud’apparitiond’un obstacle qui s’oppose à l’enracinement (profondeurrhizofonctionnelle).Dansundeuxième temps, laqualitédumilieuainsioffertaux racinesestprécisée,quidépenddela porosité, de la texture et des éventuelles contraintes.Ces observations sont synthétisées sous la forme d’unsigle comportant : la texture des horizons prospectés parles racines, la nature de l’obstacle à l’enracinement et saprofondeurd’apparitionetenfin leséventuellescontraintes(anoxie,pierrosité,sensibilitéàlasécheresseouàl’érosion,etc.), et rattachées à des typesmorphogénétiques de sol.Ensuite,cesdonnéesponctuellesontétégéoréférencéeset

faisceauxplissés.DuNord-OuestversleSud-Estsesuccèdentleplateaubisontin(180à300 m),lefaisceaubisontin,leplateaudeMontrond(300à380 m), le faisceaudePassavantetenfinle plateau d’Amancey-Vercel (500 à 800  m). La topographieestassezcontrastéeavecunealternancedereliefsfaiblementondulés sur les plateaux, localement très karstifiés avec dessuccessions de dolines, et d’un relief beaucoup plusmarquésurlesfaisceauxplissésavecdespenteslocalementtrèsfortes,voiredepetitesfalaises.

Faisantpartieintégrantedumassifjurassien,lagéologiedelazoned’étudeestrelativementcomplexe.ElleestprincipalementcomposéedecalcairesdursdesétagesBajocien,Bathonien,OxfordienetRauracienalternantavecdesmarnesduBathoniensupérieur. Au Quaternaire, plusieurs matériaux d’épandagesont venus recouvrir ces formations : des dépôts d’origineglaciaire,desalluvionsfluviatiles,desdépôtsdeversantsetdeslimonséoliens (Dreyfuss,1965).L’originedecesderniers, leurdistributionetleurépaisseurinfluencentfortementlespropriétésdusol(Bruckert,1987).

Dans le contexte franc-comtois, où sont généralementjuxtaposésbrutalementdescalcairesfissurésetdesmarnes,ladistinctionentrelessolsaudrainagenaturelfavorablesurrochesperméableset lessolssoumisàdesépisodesd’engorgementet d’anoxie a été le premier critère pris en compte par lepédologuequiainitiélestravauxdecartographiesurl’ensembledu 1/100  000 de Besançon (Bruckert, 1987). La positiongéomorphologiquedéfinitd’abordlasituationdessolsdanslepaysage :positiondeplateau,deversant,devallée.Ellepréciseensuitelasituationdansl’unitégéomorphologique :zoneconvexe(plus sensible à l’érosion) ou dépression (pouvant recevoirdes matériaux), terrasse alluviale ou surface de divagationdesrivières,etc.Ladistributiondessolsestainsireliéeà leursituation géomorphologique et à la nature des roches sous-jacentes.SurlafeuilledeVercel,61unitéscartographiquesdesolsplusoumoinscomplexesontétédécrites(Bruckert,1987).Ellesontétéregroupéesen32unitésquicorrespondentàdestypesdesols identifiésàpartirdesobservationsponctuelles.Lesprincipalesunitéssontdétailléesdansleparagraphe 2.2.1.« Lesdonnéespédologiques ».

Sur la zone d’étude, le mode d’occupation des sols estfortement lié aux contraintes agronomiques. On peut ainsidistinguer(Gaiffeet al.,2013) :-lesforêts(principalementfeuillues) :zonesdecontraintesfortespourl’agriculture(pierrositéouhydromorphie) ;- lebocageavecpâtures :contraintesàlamiseenculturepourdiversesraisonsparmilesquelles :*soltropsuperficiel,tropcaillouteuxoutropséchantpourêtrecultivé ;* sololigotropheissudematériauxacides ;* soltrophydromorphepourpermettrelamécanisation ;- le bocage composé de cultures et de prairies : contraintescirconscrites(bancscalcairesaffleurant,épierrageoudolines) ;

Page 6: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

32 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

Figure 1a -Cartedesituationdelazonecartographiéeetrépartitiondesdonnéesponctuellespourl’apprentissageetlavalidation.Figure 1a - Location of the study area, training and validation area used with point data.

Page 7: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 33

Etude et Gestion des Sols, 20, 1, 2013

recouvrement sur des calcaires durs soit piégées dansdes fissures diaclasiques et des poches karstiques),des Brunisols bilithiques (apports de limons éoliensquaternaires).

2 - Sur les plateaux, en position dépressionnaire (formesconcaves),desColluviosolsbrunifiés.

3-Sur lesplateauxsupérieurs, lessolssontplussuperficielset s’apparentent à des Rendosols, des rendisols, desCalcosols et des Calcisols leptiques. Dans les petitescuvettes, on peut trouver localement des Réductisols humiquesoudesHistosols.

B - Les sols hydromorphes issus de roches non fracturées :On retrouve le même cortège de types de sols que

précédemment avec l’apparition de Rédoxisols voire deRéductisolsenposition topographiquedépressionnairedanslesvallonsàruisseauxpermanentsoutemporaires.

rattachées à des unités typologiques issues des 4 cartesà 1/50   000 qui composent le 100 000e de Besançon. Lesdonnées environnementales explicatives dominantes suruncerclede100 mdediamètre (cequi représente3,4ou5pixelsaupasde30 m, selon l’emplacement) autourdesobservationsontensuiteétéextraites.

Parmi les typesdesol rencontrés,ondistingued’après leRéférentielPédologique(BaizeetGirard,2009) :A - Les sols aérés issus de roches fragmentées ou d’altérites autochtones non calcaires1-Surlesplateauxenpositionsommitale(formesconvexes

ouplanes) :descalcosols,desCalcisols,desBrunisols Eutriques, souvent leptiques et mésosaturés (aussiappelés sols bruns à pellicule calcaire par les auteursdes cartes de référence), des Brunisols fersiallitiques(formations d’aspect rougeâtre que l’on trouve soit en

Figure 1b - Cartederépartitiondesdonnéessurfaciquesutiliséespourl’apprentissageetlavalidation.figure 1b - Map of the training and validation area used with surface data.

Page 8: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

34 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

l’étenduedesvaleursdesaltitudesà l’intérieurd’uncerclederayondonnéetlerapporteàlapositiondupixelcorrespondant.Cette fonctiondonneunebonne indication sur la rugositédureliefdansunvoisinagechoisi.La fonction«  focalstandard »estassezprochepuisqu’ellerenvoiel’écarttypedesvaleursdel’altitudeàl’intérieurd’uncerclederayondonnéetlerapporteàlapositiondupixelcorrespondant.

MoranetBui(2002),Grinandet al.(2008)etBehrenset al. (2010)ontmontrél’intérêtd’employerdesfiltresdeconvolutionsurdesindicestopographiquesenplusdesindicesbrutspouraugmentersensiblementlerésultatdesprédictionsenprenantencomptedifférenteséchellesdestructurationspatiale.Nousavonspar conséquent appliquéun filtre de convolutiond’undiamètrevariablede3à60pixels,soitde90à1 800 mpourcertains indices (altitude, courbure, pente et focal) tels quedécritsdansle tableau 1.Lesindicescalculésavecdestaillesdefenêtresvariablessonttestésdefaçonitérative(tableau 1), pour les prédictions à partir des données ponctuelles etsurfaciques. Les meilleurs indices sont retenus sur la based’une validation interne, c’est-à-dire par comparaison desvaleurs prédites avec les valeurs observées sur la zoned’apprentissage.Lemodèleestensuiteextrapoléàl’ensemblede lacarte.Le résultatdecesprédictionsétant relativementbruité,l’imageproduiteparMARTaensuiteétélisséeavecunfiltredetype« focalmajority ».

Les données de validationLazoneutiliséepourlavalidationinterneeffectuéesurlejeu

dedonnéessurfaciquesestreprésentésurlafigure 1bparlesplagesrougesetvertes.Autrementdit,l’ensembledesdonnéessurfaciquesdisponiblesaétéutilisépourcettevalidation.Nousavonsprisauhasard20 %despixelsrépartisdefaçonaléatoireauseindecesplagespourajuster lemodèleetnous l’avonsvalidéavecles80 %restants.

le modèle maRtLesprédictionssesontdansunpremiertempsappuyéessur

lemodèleMART (FriedmanandMeulman,2003).L’algorithmefonctionnedemanièreitérativeenaffinantpuiscombinantdesarbresdedécisionpourproduireuneclassification.Pourajusterlemodèle, nous avons pris un échantillon aléatoire de 20 %despixelsdechaqueclassede lazoned’apprentissagepourlesdonnéessurfaciqueset50 %pourlesdonnéesponctuelles.Cetteméthodegarantitquemêmelesclassespeureprésentéessont prises en compte (Grinand et al., 2008 ;Moran and Bui,2002). Elith et al. (2008) rapportent que le paramètre le plusinfluent dans les arbres de classification boostés est le tauxd’apprentissage.Le tauxd’apprentissageainsique la fractiondu jeu de données prise aléatoirement pour chaque itérationsont lesdeuxparamètresquidéterminent lenombred’arbresnécessairespouruneprédictionoptimale.Les résultatsd’une

C - Les sols bien drainés issus d’altérites acides ou de limons sur substrats rocheux fissurésIlsselocalisentauniveaudesfaisceauxplissésetdesreculées1.

OnyobserveprincipalementdesBrunisols dystriques et desalocrisols typiques.

D - Les sols des versants à pentes très fortes (>50%) et fronts de bancs :

Onobservedesrendosols colluviaux,descolluviosols hémi-organiques,humifèresoucalcaires,auniveaudesthalwegsetdeslithosolssurlespartiesérodées.

E - Les sols des terrasses du lit majeur du Doubs :CessolscomprennentdesFluviosols BruniFiés ou typiques

etdescolluviosols BruniFiéscomplexes.CesUnitésTypologiquesdeSol(UTS)s’organisentdefaçon

plusoumoinscomplexeauseindesunitéscartographiques.LesUCSontétérasteriséessurlagrillederéférenceduMNEASTERaupasde30 m.Onaainsiproduitunrasterde32unitéssimplespour la prédiction réalisée à partir des données ponctuelleset un raster de 61 unités complexes pour celle réalisée àpartirdesdonnéessurfaciques.Lesdonnées fourniespar lescartesetobservationsexistantesontétécomplétéespardeuxcampagnesdeterrainsuccessivesd’unesemainechacune,quiontpermisdes’approprierlesloisderépartitiondessolsdansle paysage et de compléter les zones non couvertes par lesobservationsponctuellesexistantes.

Les données prédictivesElles sont issues de 15 variables environnementales

quantitativesetqualitatives(tableau 1),déclinéesen46variablesparunjeudefiltresdeconvolutiondediamètresdifférents.

Onpeutdistinguerdeuxgrandescatégoriesdevariables :d’unepart, lesdonnéesdérivéesduMNEASTER2 aupasde30 m,généralementquantitativeset,d’autrepart, lesdonnéesenvironnementalesissuesdelagéologieoudel’occupationdusol.

Lesindicestopographiquessontgénéralementdesvariablespertinentespourprédirel’organisationdessolsdanslepaysage(Scull, 2003). Nous avons retenu cinq indices directementdérivés du MNE : l’altitude, la pente, la courbure verticale ethorizontale et l’orientation. Trois autres indicesont égalementété pris en compte en raison de leur capacité d’intégrationspatiale. Il s’agitdu «  focal variety  »,du «  focal standard  »etdu« focalrange ».Lafonction« focalvariety »d’arcinfoaétéutiliséepourcalculer,pourchaquepixel, lenombredevaleursuniquesd’altitudesà l’intérieurd’uncerclede rayondonnéetle rapporte à la position du pixel correspondant. La fonction«  focal range »aétéutiliséepourcalculer,pourchaquepixel,

1 Vallée ou canyon de courte dimension, creusé profondément en bordure d’un causse et se terminant vers l’amont par un amphithéâtre (Conseil international de la langue française, 1979)2 ASTER GDEM is a product of METI and NASA

Page 9: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 35

Etude et Gestion des Sols, 20, 1, 2013

polygones, obtenu après lissage et vectorisation du résultatde la classification, doit pouvoir servir de référence pour letracéde lacartefinale.Lacartedes incertitudesapporteuneaideimportantequantàlaqualitédutracédespolygonesetàleurcontenu.Ellemeteneffetenévidencedeszonesdeforteincertitude sur lesquelles la prédiction issue de la démarcheponctuelleapporteuncomplémentd’informationprécieuxpourlepédologue.Ilpeutainsilocalementredéfinirunnouveautracéguidé par la prédiction ponctuelle. C’est ainsi que le pédo-cartographepeutproduirelasynthèsedesdeuxapproches.

Le travail d’expertise a consisté à vérifier la validité de laprédiction(numérod’UCetcontoursdesplagescartographiques)obtenueparlecroisementdesdeuxapproches.

Cettevérificationaétéréaliséeselonplusieursétapes :- vérification, pour l’ensemble de la carte, de la concordancedes contours et des types de sols attribués aux plagescartographiquesparlesdeuxprédictions ;

analysedelasensibilitédumodèle(nonmontrésici)ontconduitàchoisirlesparamètressuivants :taillede l’arbre= 6, tauxd’apprentissage= 20%du jeudedonnées, fraction du jeu de données prise aléatoirementpourchaqueitération= 20%,nombremaximumd’itérations= 200.

la combinaison des approches ponctuelle et surfacique

L’originalitédenotreapprocheconsisteàemployercommedonnéesd’apprentissage,d’unepart,desdonnéesponctuelleset,d’autrepart,desdonnéessurfaciques.Lesdeuxdémarchessont conduites en parallèle (figure  2). La carte obtenue àpartir de données surfaciques est la plus intéressante pourle pédologue car elle représente des unités complexes quiintègrent ladiversitédesUTSauseindesUCS.Le tracédes

Tableau  1 -Variablesenvironnementalesutiliséespourprédirelestypesdesols.*Moyenne(étendue) :valeurssansfiltredeconvolution**Moyenne(étendue) :valeursavecunfiltredeconvolutionde60pixels.***Type :« c »pourcontinueset« d »pourdiscrètes.table 1 - Environment predictors used to predict the soil types. * average : value without convolution filter. ** average : value with 60 pixels convolution filter.

Nom Description(unité) Diamètredesfiltresdeconvolutionenpixels(30x30m) Type*** Moyenne(étendue)

Variables dérivées du MNE

mne Altitude(m) 3-6-9-12-15-20-30-60 c 495(178 ;838)*

mne90 Altitudeaupasde90 mduSRTM Aucun c 500(244 ;828)*

pente Penteen % 12-15-20-30-60 c 11(0 ;170)*

curv_v Courbureverticaledurelief 3-6-9-12-15-20-30-60 c 0,02(-0,943 ;0,996)*

curv_h Courburehorizontaledurelief 3-6-9-12-15-20-30-60 c 0,02(-0,864 ;0,0765)*

fr Focalrange 20-30-60 c 185(34 ;413)**

fv Focalvariety 20-30-60 c 183(34 ;395)**

fs Focalstandard 20-30-60 c 39(7 ;110)**

dppr Distanceauplusprocheréseaudedrainage Aucun c 246(0 ;3 037)

hppr Différenced’altitudeparrapportauplusprocheréseaudedrainage Aucun c 33(0 ;332)

flowacc Logarithmenépériendel’accumulationduflux Aucun c 1,51(0 ;12,98)

flowdir Directionduflux Aucun d 8classes

expo Expositionduversant Aucun d 10 classes

Variabales thématiques

geol Cartegéologiqueau1/50 000(BRGM) Aucun d 22classes

clc CorineLandCover(SOES) Aucun d 8classes

Page 10: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

36 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

Résultats

Prédiction d’après les données ponctuelles

Evaluation du modèleL’analyse de la contribution relative des variables pour

l’ensembledesclasses(tableau 2)aétéproduiteàpartirdujeudedonnéesutilisépourajusterlemodèlesoit50 %despixels.Ellemontrequedeuxvariablessedistinguentparticulièrement :lagéologieetl’exposition.Avecdesvaleursde100 %et94 %del’importancerelative,ellessedétachentnettementdesautresvariables telles que l’altitude lissée sur un rayon de 1 800  m

- pour les secteurs comportant des données (surfaciques et/ouponctuelles),comparaisondescontoursetdestypesdesoldesplagescartographiquespréditesaveclescontourset/oulesplagescartographiquesdessinéessurlesminutesdeterrain ;- pour les «  zones vierges  », vérificationde la cohérencedescontours et des types de sols des plages cartographiquesprédites, en les comparant d’une part avec leurs voisines,et, d’autre part, avec celles présentant les mêmes variablesextrinsèques sur les trois autres cartes déjà réalisées par lespédologues(Besançon,QuingeyetOrnans)etquiencadrentlacartedeVercel.

Figure  2 -SchémaorganisationnelutilisépourprédirelestypesdesolssurlacartedeVercelàpartirdesdonnéessurfaciquesetponctuellesàl’aidedel’algorithmeMART.Figure  2 - Computational scheme used to predict soil types from surface and pontcual data with MART model on Vercel map.

OK?

y=f(xn)

OK?

OK?

y=f(xn)

OK?

Variables prédictivesenvironnementales

Validationinterne

Extrapolation

Lissage par« focal majority »

Modelisationavec MART

Synthèse des 2 cartes par le pédologue

Données d’apprentissage ponctuelles

Données d’apprentissage surfaciques

Validation Externe

Données ponctuelles

Données surfaciques

Page 11: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 37

Etude et Gestion des Sols, 20, 1, 2013

Validation interneLa validation interne2 de la prédiction effectuée à partir

de 20 % des pixels pris au hasard dans le jeu des donnéesponctuelles (tableau  3) montre un indice global de prédictionde 81  % pour un indice de kappa de 0.78. Le modèle estdonc globalement bien ajusté. Les erreurs d’omission3 sont relativement faibles : de 1 à 31 % avec un taux relativementélevépourlesclassestrèsreprésentéescommelesclasses3,4,5et7(Brunisol ; Quasi-luvisol ; Brunisol EutriQuE leptiqueet mésosaturé, colluviosolbrunifié)quisonteneffetdessolsrelativement semblables au regard des variables pouvantles distinguer. Les erreurs de commission4 sont en généralplus élevées que les erreurs d’omission. Ces dernières sontcomprisesentre14à41 %etconcernent,pourlesvaleurslesplus élevées, des classes relativement peu représentées : 13,14et18(Brunisol eutrique colluvial ; Quasi-luvisolrédoxique ;calcosol leptique).

La carte produite à l’issue de cette validation estreprésentée sur la figure  3a. Elle est tout à fait cohérenteavec les données ponctuelles utilisées pour l’apprentissage

2 On parle de validation interne lorsque le même jeu de données sert à la fois à la calibration et à la validation de la prédiction.3 Rapport entre le nombre total de pixels prédits pour une classe donnée et ceux correctement affectés à la classe prédite rapporté en pourcentage.4 Rapport entre nombre total de pixels observés pour une classe données et ceux correctement affectés à la classe observée rapporté en pourcentage.

(64  %) et l’occupation du sol (59  %). La plupart des autresvariablesretenuesparlemodèlesesituententre50et56 %.Ilestintéressantdeconstaterqueparmiles46variablesutilisées,lamajoritédesvariablessecondaires,danslagammedes50 %,concernedes indicesdecourbureavecdes focalesde taillesdifférentes.

Lacontributionrelativedesvariablespour les14classeslesplusreprésentées(tableau 2),montreque,pourlamajoritédes sols prédits, la géologie et l’exposition apportent lamajoritédelacontributionrelativeaumodèle.Letauxd’erreurcalculésur lesdonnéesdecalibration (comparaisondu typedesolobservéetmodélisé,surlespixelsayantserviàajusterlemodèle) reste inférieur à20 %pour lamoitiédesclassesprédites.

Le taux le plus faible (5  %) est atteint pour la classe15, correspondant aux Rédoxisols limoneux appauvris ensurfacequisontassez faiblement représentésetdansdessituationstopographiquesbienmarquées.Letauxd’erreurleplusélevé(40 %)concernelaclasse13(Brunisols eutriques colluviaux). A part la géologie et l’exposition, les autresvariables n’apportentpas suffisammentd’informationpourdistinguercetteclassedesautres.Ilconvientaussidenoterqued’unpointdevuefonctionnel,cetteclasseserapprochefortementdesunités3,5et7(Brunisol ; Brunisol EutriQuE ; colluviosolbrunifié).

Figure  3 -Prédictionsdestypesdesold’aprèslesdonnéesponctuelles :classesprédites(a)etcartesdesprobabilitésd’occurrence(b).Figure  3 - Soil Types predictions obtained with the punctual data : predicted classes (a) and probability map (b).

Page 12: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

38 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

Tableau  2 - Analysedelacontributionrelativedes11variableslesplusimportantespourles14classeslesplusreprésentées.Lesvaleursdecontributionrelativedesvariablessupérieuresà60 %figurentengras.Letauxd’erreurtotalcorrespondàl’erreurd’affectationcalculéesurlespixelsutiliséspourajusterlemodèleUnitésdeSoldécrites :1= CALCOSOL ;2=CALCISOL ;3=BRUNISOL ;4=QUASI-LUVISOL ;5=BRUNISOLEUTRIQUE,leptiques,mésosaturés ; 6=BRUNISOLFERSIALLITIQUE ;7=COLLUVIOSOLBRUINFIE ;8=QUASI-LUVISOLetBRUNISOL ;13=BRUNISOLEUTRIQUE,colluvial ;14= QUASI-LUVISOLREDOXIQUE ;15=REDOXISOLSlimoneuxappauvrisensurface ;17=REDOXISOLSréductiques ; 18=CALCOSOLSleptiques ;19=CALCISOLSleptiques.Table 2 - Relative contribution of the variables the 16 more represented classes. Bold type indicates variables accounting for more than 60 % in the classification. The total error rate corresponds to the affectation error calculated on the pixels used to ajust the model.

Unités deSol

Contributionrelative(%) Tauxd’erreurtotal(%)geol expo mne_60 clc curvv_60 curvh_60 pente_60 curvh_30 curvv_30 pente_3 fs_60

toutes 100 94 64 59 57 56 56 55 55 54 53 19

1 100 98 32 74 49 - 37 39 31 - - 27

2 96 100 77 47 48 46 39 42 42 53 37 21

3 99 100 88 - - 75 68 72 - 63 61 11

4 100 95 72 63 66 82 - 77 70 - 69 17

5 100 86 52 73 64 57 79 49 67 52 - 15

6 100 98 62 77 68 49 65 64 50 48 67 25

7 100 92 59 56 74 - - 70 58 54 60 14

8 80 100 63 - 52 51 - 54 40 - 57 18

13 92 100 53 - 54 45 46 - 77 51 59 40

14 100 72 27 43 38 - 60 - 27 - 27 12

15 100 74 - 40 52 35 35 33 27 47 61 5

17 98 100 92 67 - 56 58 - 46 - - 24

18 92 100 37 64 40 36 68 56 57 40 39 41

19 100 81 69 49 71 61 - 56 67 70 54 21

Tableau  3 - Matricedeconfusionsynthétiquedesunitésdesolslesplusreprésentéeslorsd’unevalidationinterneaveclesdonnéesponctuelles.Table 3 - Accuracy of the most represented soil types prediction in training area with the point data.

unités de sol

1 2 3 4 5 6 7 8 13 14 15 17 18 19

Nombredepixelsprédits

108 254 1719 1208 1552 287 1351 152 125 69 79 109 122 502

Erreurd'omission(%) 31 30 15 23 14 24 20 22 41 32 30 21 33 30

Erreurdecommission(%)

1 9 31 28 29 12 29 5 10 3 4 6 2 15

Précisionglobale(%) 81

IndiceKappa 0,78

Page 13: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 39

Etude et Gestion des Sols, 20, 1, 2013

modèle,ajustésurunjeudedonnéesd’apprentissageissudecartes pédologiques existantes, évince l’exposition qui étaittrès importante dans la prédiction «  ponctuelle  » et relèguel’occupationdusolau6erangparordred’importance.Ildonneenoutrelaprimeuràl’altitude(mne_60etmne_30)ainsiqu’àlapente(pente_60)etau« focalstandard »(fs_60).

Validation interneLa matrice de confusion tirée de cette validation interne

est présentée dans le tableau  4. Avec un indice global de94  % et un Kappa de 0.93, on constate que le modèle estfinementajusté,voiresur-ajusté.Leserreursd’omissionetdecommissionsesituentenmoyenneendessousde10 %.Parmilesclassesprésentéesici,cellequiatteintletauxleplusélevé(32 %)correspondàl’unitélamoinsbienreprésentée,laclasse17 (rédoxisols réductiques), avec seulement 124 pixels, alorsque les autres classes en comptent généralement plusieursmilliers.Laclasse10 (associationdeBrunisolssuperficielsetcolluviosols)pourlaquellel’erreurd’omissionestlaplusfaible

(non présenté ici) et fait ressortir les unités présentes sur lesfaisceaux plissés (colluviosols brunifiés) ainsi que cellesmajoritairessurlesplateaux(Quasi-luvisol ; Brunisol EutriQuE).On retrouve bien localement l’unité 6 correspondant auxBrunisols Fersiallitiques sur le quart Nord-Est. La carte desprobabilitésd’occurrence indiqueuneassezbonne répartitiondespixelsbienpréditssurl’ensembledelacartesansqu’ilyaitvéritablementde« terraincognita »selonlemodèle.Leszonesmalprédites(figure 3b(probabilitéd’occurrencefaible))restentrelativementclairsemées,depetite tailleetentouréespardespixelsbienclassés.Onnepeutpas ydistinguerde structurespatialeproprementdite.

Prédiction d’après les données surfaciques

Importance des différentes variablesL’analyse de l’importance relative des variables utilisées

pour laprédictiondite «  surfacique  » (figure 6)montreque le

Figure  4 -Analysedelacontributionrelativedesvariablespourtouteslesclassesprisesdansleurensemblepourlesdonnéesponctuelles.Figure  4 - Relative contribution of the main variables for all classes with the point data.

geolexpo

mne_60clc

curv_v_60curv_h_60pente_60

curv_v_30curv_h_30

pente_3fs_60

mne_30curv_v_20curv_h_6

fv_60curv_v_15pente_30

mne_3curv_v_3curv_v_6

Relative importance0 20 40 60 80 100

Input variable importances for all classes

Page 14: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

40 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

Tableau 4 - Matricedeconfusionsynthétiquede14unitésdesols(lesplusfréquentes)lorsd’unevalidationinterneaveclesdonnéessurfaciques.Table 4 - Accuracy of the most represented soil types prediction in training area with the surface data.

unités de sol

1 2 3 4 5 6 7 8 13 14 15 17 18 19

Nombredepixelsprédits

357 1 059 4 555 4 270 3 687 4 686 836 4 273 7 193 597 3 291 697 124 1 418

Erreurd'omission(%) 14 9 7 7 7 7 20 6 1 10 3 13 32 13

Erreurdecommission(%)

1 4 7 9 9 9 3 10 2 1 3 1 15 8

Précisionglobale(%) 94

IndiceKappa 0,93

Figure 5 -Evolutiondel’indicedeclassificationglobal(G)etduKappa(K)exprimésen %enfonctiondelatailledelafenêtredelissagedesindicestopographiquesexprimésennombredepixels.Figure 5 - Global classification index (G) and Kappa index (K) evolution depending on the size of the focal mean window used on the topographic index in pixels.

0,90

0,80

0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,003 6 9 12 15 20 30 60

Taille de la fenêtre d’intégration en pixels

GK

Page 15: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 41

Etude et Gestion des Sols, 20, 1, 2013

nousavonsamputélejeudedonnéesde20 %desasurfacelelongd’unebandeobliquetraversantlacarteduNord-OuestversleSud-Est (cf. la zone figurée en vert sur la figure 1b).Cetteorientation perpendiculaire aux faisceaux plissés présentel’avantagedeprendre en compte la grandemajorité des solsprésents dans le jeu de données initial de sorte que la zoned’apprentissage(représentéeenvertsurlaFigure1b)etlazonedevalidation (représentéeenrouge)comprennentexactementles mêmes unités de sols. Lemodèle a cette fois été ajustéuniquement à partir des données représentées en vert etextrapolésurlesdonnéesreprésentéesenrouge.Lamatricedeconfusion(tableau 5)quirésultedel’analysedecetteprédictionexternemontreuneprécisionglobale(G)de46 %etunKappade 0.31 qui pourrait être expliqué par un surajustement dumodèleavec lesdonnéesdecalibration.Cesrésultats restentcependant du même ordre de grandeur que ceux obtenusparGrinandet al., (2008) et Lemercieret al., (2012) dansdesconditionscomparables.Enignorantdesclassesextrêmementpeu représentées, comme les classes 8, 13, 16 et 19, on

(1 %) est également la classe la plus représentée avec 7 193pixelsutiliséspourlaprédiction.

Les erreurs de commission sont encore plus faibles. Lemaximumde15 %estégalementatteintpar laclasse17.Lesclasseslesplusreprésentéesconserventdestauxd’erreurdecommissioninférieursà10 %.

Lacartedesprobabilitésissuedelaprédictionsurfacique(figure 7b) montrequeladistributiondesvaleursfaiblessuitunecertaine organisation spatiale très différente de celle obtenueaveclesdonnéesponctuelles(figure 3b).Onobserveeneffetsurla figure 7bunefortedisparitédesvaleursdeprobabilitéentreles zones couvertes par la carte existante très bien préditessupérieuresà83 %etleszonesàprédireinférieuresà23 %.

Validation externeNous avons simulé une validation externe au sein du jeu

dedonnéessurfaciquesafindetesterlasensibilitédumodèlesurunezoneexemptededonnéespédologiques.Pourcefaire,

Figure 6 -Analysedel’importancerelativedesvariablespourtouteslesclassesprisesdansleurensemblepourlesdonnéessurfaciques.Figure 6 - Relative contribution of the main variables for all classes with the surface data.

mne_60geol

mne_30pente_60

fs_60clc

curv_v_60fv_60fr_60

mne90curv_h_60

mne_3curv_v_30pente_30

fs_30fs_20

pente_20fr_30

curv_h_30pente_12

Relative importance0 20 40 60 80 100

Input v a r ia ble importa nc es for a ll c la s s es

Page 16: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

42 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

Synthèse des approches ponctuelles et surfaciques établie par le pédologue

Choix des contoursLarègledebaseétantdes’écarterlemoinspossibledela

cartographie déjà réalisée, nous avons privilégié les contourspréditsàpartirdesdonnéessurfaciques,enparticulierdanslessecteursdessinésnonlabellisés,etdanslessecteursvierges.

Enrevanche,pourlessecteurscontenantdesinformationsponctuellessanscontours,lechoixdescontoursproposésparl’une ou l’autre approche a été raisonné après synthèse desdonnéesponctuelles.

Choix des numéros des labels (numéros des UCS)Les labelsattribuéspar lespédologuesdans lessecteurs

cartographiésontétéleplussouventconservés.Pourlesautressecteurs,lechoixdulabels’estavéréplus

long à réaliser car il a nécessité une comparaison polygonepar polygone des labels proposés par les deux prédictions.Pourtrancher, ilafallusouventremonteràladonnéedebase(sondagesouprofils) ;c’estdoncl’approcheponctuellequiaétéprivilégiéepourcetteopération.Aufinal,letypedesolattribuéàchaquepolygonecorrespondsoitautypedesoldominantdanslaplagecartographique,soitàuncomplexedesols.

La figure  8 décrit synthétiquement cette démarche entroisétapes.Onyvoitdanslapartiesupérieurelerésultatdesprédictions surfaciques, à gauche et ponctuelles, à droite.

constate que les erreurs d’omission et de commission sont,touteschoseségalesparailleurs,relativementacceptablesavecdestauxrespectifsde9 %et34 %.

Lissage des données avec un filtre de convolution majoritaire

LemodèleMARTnouspermetd’obtenir in finedeuxcartesayant chacune des données d’entrées différentes, ponctuellesou surfaciques. Les cartes ainsi obtenues et validées tel quedécritdanslesparagraphes 3.1et3.2ontunrendurelativementbruité,notammentsurleszonesoùlesprobabilitésd’occurrencesont lesplus faibles (figures 3b et 7b).Nousavonseu recoursàunfiltredeconvolutionretenantlavaleurlaplusfréquenteauseind’unefenêtrecirculairede7pixelsdediamètre(soit210 m)aveclafonction« focalmajority »d’ArcInfo®afindelisserl’imageissuedelaprédiction.Lacarteainsiobtenueminimiselebruitetaccentuelescontoursentrelesunitésdesols.Cerésultatesttoutàfaitsimilaireàceluiobtenuavecl’algorithmeCLAPAS(Robbez-Masson,1994)enraisonnantsurdesclassescomposéesd’uneseule unité de sol. Nous avons ainsi retenu la fonction «  focalmajority »pourdesraisonsdefacilitéd’utilisation-lafonctionestdirectementaccessiblesousArcInfo-etdetempsdecalcul.

Figure 7 -Prédictionsdestypesdesolsd’aprèslesdonnéessurfaciques :classesprédites(a)etcartesdesprobabilitésd’occurrence(b).Figure 7 - Soil Types predictions obtained with the existing soil map : predicted classes (a) and probability map (b).

Page 17: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 43

Etude et Gestion des Sols, 20, 1, 2013

Figure 8 -Etapesdelamodélisationàlaproductioncartographique :1-ModélisationetprédictionavecMART2-Lissagedescartesproduitespourunrenducartographique3-Synthèsedesprédictionsparlepédologue.

Figure 8 - Steps from modeling up to map achievement :1 - modeling and prediction with MART2 - smoothing of the prediction map for a better readability3 - synthesis of the smoothed maps made by the soil scientist.

Page 18: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

44 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

(tableau 5).L’évolutionde l’indicedeclassificationglobal (G) et du

Kappa (K) en fonction de la taille de la fenêtre de lissagedes indices topographiques (figure  5), toujours dans lecadre d’une validation interne, met en évidence l’intérêtd’utiliser des indices lissés sur une vaste surface. Pourétablir ce graphique, de nombreux tests ont été réalisésaveclemêmejeudedonnéesenajoutantàchaqueitérationles indices topographiques calculés avec une fenêtre detaille supérieure. Ainsi, pour la première itération, tous lesindices topographiques sont lissés par un «  focal mean  »d’undiamètrede3pixels ; lorsde la seconde itérationonremet en jeu les indices de la première itération plus lesindices topographiques lissés par un «  focal mean  » d’undiamètrede6pixelsetainsidesuitejusqu’à60.Lenombred’indicesutiliséscroîtainsirapidementetnousavonsatteintleslimitesdecalculsousRauboutdela8e itération. Il est ànoterquelemodèle,aprèschaqueitération,accordeuneimportance relative plus grande aux indices ayant la plusvastefenêtred’intégrationspatiale.Onretrouvecerésultatdans la figure  4 où les premiers indices topographiquesapparaissant par ordre d’importance sont : le mne_60, lecurv_v60 le curv_v_h60 et le pente_60.Ces résultats sontpar ailleurs tout à fait cohérents avec ceux obtenus parBehrenset al.(2010).

Avantages et limites de la synthèse des approches ponctuelles et surfaciques

Pour la prédiction cartographique, les contours de laprédictionobtenueaveclesdonnéesd’entréessurfaciquesontétéprivilégiéspourdeuxraisons.D’unepart,ellesontmontréplusderobustesseetunmeilleurtauxderéussitenotammentavec lesmatricesdeconfusion (tableaux 3, 4 et 5)et,d’autrepart, en comparant le tracé des unités cartographiques descartesexistantesaveccelui issudesprédictions,onconstatequ’ilscoïncidentparfaitementsurlespartiescommunesetque

Lapartie centrale expose lesmêmescartes aprèsun lissageavecunefenêtreglissantedetype«  focalmajority ».Lacarteprésentéeenbasestunextraitdecellepubliéeau1/100  000quiestvéritablementlasynthèsedesdeuxprécédentes.

DisCussioN

Performance intrinsèque des modèles utilisés sur Vercel

Les coefficients globaux (G) de classification obtenuspour lesvalidations internesdes jeuxdedonnéesponctuelleset surfaciques, respectivement81 %et94 %sont tout à faitcohérentsavecceuxobtenusavecdesarbresde régressionsboostéstelsquedécritdanslalittérature.MoranetBui(2002)ontpréditdes typesdesolsàpartirdevariablesdérivéesduMNTetissuesdelatélédétectionavecunGde70 %.Grinandet al.(2008)ontobtenuunGde69 %surlemêmetypededonnéeset 89  % en les lissant au moyen d’un filtre de convolutioncomparable à celui utilisé dans notre étude. Lemercier et al (2012)ontpréditdesmatériauxparentauxetclassesdedrainagedusolavecdestauxde73 %et70 %.AlasuitedeMoranetBui(2002),Grinandet al.(2008)etBehrenset al.(2010),onmontreunefoisdeplusquel’emploidefiltresdeconvolutiondeplusenplusvastesspatialementaugmentesensiblementlaqualitédelaprédictioninterne(figure 5).

Il est important de noter que le modèle MART présenteégalementl’avantagedegérerunnombreimportantdeclassespourlaprédiction.Surla figure 7a,quireprésentel’applicationd’un modèle ajusté sur l’ensemble des données existantes(validé sur la base d’une validation interne), nous avons puspatialiserles61unitéscartographiquesdesols(àlafoispuresetcomplexes).Lamatricedeconfusionétabliesurlabased’unevalidation interne (tableau  4) montre que le modèle est bienajustémaisperddesaprécision lorsd’unevalidationexterne

Tableau 5 - Matricedeconfusionsynthétiquede14unitésdesols(lesplusfréquentes)lorsd’unevalidationexterneaveclesdonnéessurfaciques.table 5 - Accuracy of the most represented soil types prediction in validation area with the surface data.

unités de sol

1 2 3 4 5 6 7 8 13 14 15 17 18 19

Nombredepixelsprédits 141 643 1 107 1 708 405 2 860 36 1 940 5 428 1 841 16 162 163

Erreurd'omission(%) 20 53 36 23 13 42 4 48 91 0 5 0 84 12

Erreurdecommission(%) 30 37 31 21 23 25 75 41 66 0 8 0 42 31

Précisionglobale(%) 46

IndiceKappa 0,31

Page 19: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

Cartographie numérique des sols de Vercel (Doubs) 45

Etude et Gestion des Sols, 20, 1, 2013

qui régissent en partie la distribution des BRUNISOLS,QUASI-LUVISOLS, BRUNISOLS à pellicules calcaires et lesCOLLUVIOSOLS brunifiés (classes 3, 4, 5 et 7), ainsi que lanécessitéde synthétiser desprédictions ayant un nombredeclasses différentes en sortie (32 classes pour les prédictionsponctuelleset61pour lesprédictionssurfaciques),ontaboutiàunesimplificationinévitabledelacartographieàl’échelledu1/50 000.

CoNCLusioNLebutdecestravauxétaitd’aiderunpédologueàfinaliser

unecartedessolsau1/50 000entaméeparsesprédécesseurssur1/4desasurface.Afindeminimiserletempsdecartographiesurleterrain,nousavonschoisid’avoirrecoursàdestechniquesde cartographie numérique permettant d’extrapoler lesinformationsexistantessurdeszonescomparablesentermedegéologie,d’occupationdusoletdegéomorphologie,toutescesinformationsétantfacilementdisponibles.Nousavonspourcelaeurecoursàdesarbresderégressionboostéspourprédirelessolssurles3/4restants.

Lesrésultatsdecestravauxmontrentl’intérêtd’utiliserdesvariablestopographiquesavecdifférentsniveauxderésolutionspatiale ainsi que l’intérêt de combiner une approchesurfacique et ponctuelle. Ceci est vrai notamment lorsqueles données ponctuelles sont bien réparties sur l’ensemblede lacartealorsque lesdonnéessurfaciquesn’existentquesur une portion restreinte. La combinaison des deux cartesnécessite l’expertisedupédologuequi,parsaconnaissancedu terrain et des lois locales de répartition des sols, peutainsidéterminer le tracédéfinitifdesunitéscartographiques.L’approcheconduiteainsidoitêtreconsidéréecommeunoutild’aideàlacartographieetnepeutenaucuncassesubstituerà la connaissance préalable du terrain. Comme pour toutecartographiedessols,desincertitudesdemeurentmaisnoussommesenmesuredelesquantifieretdeleslocaliser.LacartedessolsdeVercel,dont lafinalisationaété renduepossibledans le temps imparti grâce à la cartographie numérique, apermisdecompléterlacarteau1/100 000deBesançonquiaétépubliéecetteannée.

REMERCiEMENTsLesauteursremercientlesprospecteursquiontparticipé

auxcampagnesdeterrain(EugénieTientcheu,LineBoulonne,Laurent Richard) menées dans le cadre de cette étude. Laréalisationde lacarte1/50 000deVercelest inscritedans leprogrammeCPF (Connaissance Pédologique de France) quiconstitue l’un des volets du programme IGCS (Inventaire,Gestion et Conservation des Sols) soutenu par le Ministèrede l’Agriculture.Merci àMichèle Gaiffe pour la cession des

laprédictionprolongedefaçoncohérenteletracéexistantsurleszonesvierges.Lesprédictionsponctuellesontpermisd’enrichirlecontenudesunitéscartographiquespeuoumalpréditesauvudelacartedesprobabilitésd’occurrence(figure 7b).

AvantagesL’objectifdecetravailétaitdefinaliserlacartepédologique

1/50 000deVercelafinde réaliser le1/100 000deBesançondont elle constitue le quart nord-est. Sur 54   527  ha (surfacetotaledelacartedeVercel),18 605 haavaientétélevés,àraisonde1sondagepour17 haenmoyenne.Cecireprésenteunniveaude résolution intermédiaire entre les densités d’observationrequisespourdescartographiesau1/25   000etau1/50 000,dansdesrégionsdefortevariabilité(Le Gros,1996).

La couverture des 35 990  ha restants, avec une densitéd’observations comparable, aurait nécessité 2 213 sondagessupplémentaires. A raison de 15 à 20 sondages par jour etparpersonne, il faudraitcompterenviron130 joursde terrain.A ce travail, il conviendrait d’ajouter le temps nécessaire à lapréparationdescampagnesdesondagespuisàlasynthèsedesdonnéesetaureportdescontourssurlesminutesdeterrainsoitunevingtainedejourssupplémentaires.

La modélisation cartographique que nous avons réalisée anécessitéletravailencollaborationd’ungéomaticienetd’unexpertpédologue,quel’onpeutdécomposerdelafaçonsuivante :-préparationdesdonnées,10jours,-calibragedumodèle,3jours,-validationinterneetexterne,2jours,-concertationgéomaticien/pédologue,5jours,-synthèsedesdeuxapprochesetvalidationparlepédologue,5jours,-correctionsetnumérisationfinaledescontoursetdeslabels,5jours,-contrôlesterraindesprédictions,37jours.Soituntotalde77jours.

Onvoitdoncquel’utilisationdelacartographienumériqueapermisdefinaliserlacartedeVercelenréalisant,danscecas,uneéconomiesubstantiellede70à80joursparrapportàunecartographieconventionnelle.

LimitesBienques’appuyant,demanièrelaplusobjectivepossible,

surlesdonnéesacquisesparlaprospectiondeterrain,l’utilisationde la cartographie numérique n’a pas permis d’aboutir à unecartographiedemêmeprécisionquecelledessecteursayantdéjàfaitl’objetd’unecartographieconventionnelle.

Dece fait, lacarte1/50 000deVercelprésente,aufinal,unecertainehétérogénéitéquantà la tailledespolygonesetune qualité de prédiction variable (figures 3b et 7b), parfoisfaible,localement.

Le manque de données sur les formations superficielles(nonprisesencomptedanslacouchededonnéesgéologiques),

Page 20: Cartographie numérique - afes.fr · L’accès à un grand nombre d’observations pédologiques ... En el sector de ... Los datos puntuales sirvieron entonces para afinar la debilidad

46 S. Lehmann, M. Eimberck, M. P. Martin et D. Arrouays

Etude et Gestion des Sols, 20, 1, 2013

scaleoflocalsoilknowledgeusingboostedclassificationtrees :Atwo-stepapproach.Geoderma,171,75-84.

McKenzie N.J., Ryan P.J., 1999 - Spatial prediction of soil properties usingenvironmentalcorrelation.Geoderma89(1-2),67-94.

Mendonça-SantosM.L.,McBratneyA.B.,MinasnyB.,2006 -SoilPredictionwithSpatiallyDecomposedEnvironmentalFactors.Developments in Soil Science,31,269-278.

MichaelsenJ.,SchimelD.,FriedlM.,DavisF.,DubayahR.,1994-Regressiontreeanalysisofsatelliteandterraindataofguidevegetationsamplingandsurveys.Journal of Vegetation Science,5(5),673-686.

Minasny B., McBratney A.B., 2007 - Incorporating taxonomic distance intospatialpredictionanddigitalmappingofsoilclasses.Geoderma,142(3-4),285-293.

MoisenG.G.,FreemanE.A.,BlackardJ.A.,FrescinoT.S.,Zimmermann,N.E.,EdwardsJr.,2006-PredictingtreespeciespresenceandbasalareainUtah :acomparisonofstochasticgradientboosting,generalizedadditivemodels,andtree-basedmethods.Ecological Modelling,199(2),176-187.

Moran C.J., Bui E.N., 2002 - Spatial data mining for enhanced soil mapmodeling.International Journal of Geographical Information Science, 16 (6),533-549.

Odeh, I.O.A., McBratney, A.B., Chittleborough, D.J., 1992 - Soil patternsrecognition with fuzzy-c-mean : application to classification and soil-landforminterrelationships.Soil Science Society of America Journal, 56 (2),505-516.

PalM.,MatherP.M.,2003-Anassessmentoftheeffectivenessofdecisiontreemethodsfor landcoverclassification.Remote Sensing of Environment, 86(4),554-565.

Robbez-Masson J.M., 1994 - Reconnaissance et délimitation de motifsd’organisationspatiale.Applicationàlacartographiedespédopaysages.Th.Doct.ENSAM,161p.+annexes.

Scull P., Franklin J.,ChadwickO.A., 2005 - The application of classificationtree analysis to soil type prediction in a desert landscape.Ecological Modelling,181(1),1-15.

ScullP.,FranklinJ.,ChadwickO.A.andMcArthurD.,2003-Predictivesoilmapping :areview.Progress in Physical Geography,27(2),171-197.

WalterC.,LagacherieP.,FollainS.,2006-IntegratingPedologicalKnowledgeintoDigitalSoilMapping.Developments in Soil Science,31,281-300,

archivespédologiquesdeSylvainBruckertetàMarionBardypoursarelectureetsesconseils.Cetravailaétéconduitdanslecadrede l’axe2duRéseauMixteTechnologique« SolsetTerritoires ».

BiBliogRaPhieBaize. D., Girard. M.C. (coord.), 2009 - Référentiel pédologique 2008. Quæ

Editions,Versailles,France,405p.BehrensT.,ZhuA-X,SchmidtK.,ScholtenT.,2010-Multi-scaledigitalterrain

analysis and feature selection fordigital soilmapping.Geoderma, 155 (3-4),175-185.

BallabioC.,2009-Spatialpredictionofsoilpropertiesintemperatemountainregionsusingsupportvectorregression.Geoderma,151(3-4),338-350.

BourennaneH.,KingD.,2003-Usingmultipleexternaldriftstoestimateasoilvariable.Geoderma,114,1-18.

BoruvkaL.,PenizekV.,2006-ATestofanArtificialNeuralNetworkAllocationProcedure using the Czech Soil Survey of Agricultural Land Data.Developments in Soil Science,31,415-424.

Breiman,L.,Friedman,J.H.,Olshen,R.A.,Stone,C.J.,1984-Classificationandregressiontrees,TheWadsworthstatistics/probabilityseries.WadsworthInternationalGroup,Belmont,CA.358p.

BruckertS.,1987-Clédichotomiquedeclassementdessolsagricolesfrancs-comtoissituéenclimattempérésemi-continental,Annales scient. Univ. Besançon,Biologievégétale,4e série ;fasc.7 ;17-29.

DobosE.,HenglT.,2009-SoilMappingApplications.Developments in Soil Science,33,461-479.

DreyfussM.,1965-CartegéologiquedelaFranceà1:50000, XXXIV-23,FeuilledeVercel.ServicedelacartegéologiquedeFrance,BRGM,8p.

ElithJ.,LeathwickJ.R.,HastieT.,2008-Aworkingguidetoboostedregressiontrees. Journal of Animal Ecology,77(4),802-813.

FriedmanJ.H.,2002-Stochasticgradientboosting.Computational Statistics and Data Analysis,38(4),367-378.

Friedman J.H.,Meulman J.J., 2003 -Multiple additive regression treeswithapplicationinepidemiology.Statistics in Medicine,22(9),1365-1381.

M.Gaiffe,S.Bruckert,M.Eimberck(coll.),2013.CartepédologiquedeFranceà1/100 000 :Besançon.EditionsQuae,Collectioncartesetréférentielspédologiques,250p.

GrinandC., Arrouays D., Laroche B.,MartinM.P., 2008 - Extrapolating regionallandscapes from an existing soil map : sampling intensity, validationprocedures,andintegrationofspatialcontext.Geoderma,143(1-2),180-190.

IndykP.,RajeevMotwaniR.,1998-ApproximateNearestNeighbors :TowardsRemovingtheCurseofDimensionality.,in‘98ProceedingsofthethirtiethannualACMsymposiumonTheoryofcomputing’.pp.604-613.

LawrenceR.,BunnA.,PowellS.,ZambonM.,2004-Classificationof remotelysensed imagery using stochastic gradient boosting as a refinement ofclassificationtreeanalysis.Remote Sensing of Environment,90(3),331-336.

Lees B.G., Ritman K., 1991 - Decision-tree and rule induction approach tointegrationof remotely sensedandGISdata inmapping vegetation indisturbed hilly environments.Environmental Management, 15 (6), 823-831.

LegrosJP.1996 -Cartographiesdessols.De l’analysespatialeà lagestiondes territoires. Presses polytechniques et universitaires romandes.Lausanne,Suisse.411p.

Lehmann S, Bégon JC, Eimberck M, Daroussin J, Wynns R, Arrouays D.2007 - Utilisation du logiciel CLAPAS pour l’aide à la délimitation depédopaysages.UntestsurlacartedessolsdeMirande(Gers,France).Etude et Gestion des Sols,14(2) :135-151.

Lemercier,B. ;Lacoste,M. ;Loum,M. ;Walter,C.2012-Extrapolationatregional