ecoOnto - une ontologie pour la biodiversité

Preview:

DESCRIPTION

Workshop Sémantique & Ontologies AnaEE-France

Citation preview

EcoOnto, une ontologie pour la Biodiversité

Acquisition, structuration et valorisation de données issues d’observations biologiques

Workshop Sémantique & Ontologies AnaEE-France

6 décembre 2013 - Moulis

Julie Chabalier

Plan

2010 2011 2012 2013

glossary ecoOnto-Med

La genèse … Le projet …………. La suite ……………………..........

1998

2002

Marseille

carole duval

amandine sahl

olivier coullet

1998

2002

2008

Marseille

carole duval

amandine sahl

olivier coullet

2004

2008

Marseille

Rennes

carole duval

amandine sahl

olivier coullet 2009 2008

Marseille

Des outils numériques pour la nature

ACQUÉRIR

STRUCTURER Aide à la décision : Risque de perte de

biodiversité ?

Espèces / écosystèmes à

préserver ?

DONNÉES EXISTANTES

COLLECTE

SI

BD

CARTES

GRAPHES

VALORISER

Idée Quelles sont les

zones à protéger

en PACA?

Recherche

des

données

existantes

Web

Observations à collecter

pour répondre à la

question

Proposition de

zones à protéger

en PACA

?

Données de biodiversité

Multi-

observateurs

Biologie

Multi-sites

Géographie

Génétique Pédologie Hétérogènes

Multi-modèles

Multi-formats

Données de biodiversité

Données de biodiversité liées

Projet ECO-INC ECOlogical INtelligent Census

Quelles sont les

zones à protéger

en PACA?

Observations à

collecter pour répondre

à la question

Proposition de

zones à

protéger en

PACA

ecoRelevé Knowledge

Module de connaissances

Module de données

Recherche

des données

existantes

AAP « Eco-industries » Avril 2009

• ADEME – OSEO – DGCIS (Fonds de compétitivité des entreprises)

• Type de projets : projet de développement expérimental et d’innovation individuel (PME)

• Axe : surveiller et tracer

• Thème : observer davantage et mieux l’environnement

• Projet déposé : 30 avril 2009

• Demande de financement : 390 k€ sur 3 ans

Projet Lauréat !

Financement après

négociation

Subvention 150k€ sur 1,5 an

• 50 k€ OSEO AFI –

Faisabilité du système :

ecoQuery

• 100 k€ Ministère écologie –

Ontologie : ecoOnto

• Début des travaux janvier

2010

ecoOnto

Une

ontologie

de la

biodiversité

2010 2011 2012 2013

glossary ecoOnto-Med

Comité scientifique

Comité Scientifique et

technique

Institution Domaine d’expertise

Thierry Bourgoin MNHN, FRB Systématique

Olivier Dameron INSERM/Université de Rennes 1 Web sémantique

Sophie Gachet IMEP Ecologie

Wilfried Heintz GIP ECOFOR Geomatique

Thérèse Libourel LIRMM Informatique

Ammar Mechouche IGN Web sémantique

Isabelle Mougenot LIRMM Bioinformatique

Emmanuelle Porcher MNHN Ecologie

Concepts

environnementaux

La conception de l’ontologie

WP1 – Définition des concepts

Standards en

biodiversité

Concepts

environnementaux

La conception de l’ontologie

WP2 – Mapping avec les standards

Standards en

biodiversité

Concepts

environnementaux

La conception de l’ontologie

WP3 – Top domaine ontologie

Top

domaine

ontologie

Standards en

biodiversité

Concepts

environnementaux

La conception de l’ontologie

WP4 – Mapping et extension

Inventaire des concepts

Un glossaire pour la biodiversité

1. Lister un ensemble de questions environnementales

2. Extraire les concepts

3. Définir des concepts

Exemple :

Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?

Le glossaire Un concept [fr] :

[label préféré; synonymes; Définitions; Références; termes associés]

label préféré : Impact sur l’environnement

Synonymes : Conséquence sur l’environnement, effet sur l’environnement

Définitions :

1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique

d'écosystème.

2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement

des activités, produits ou services d’un organisme.

Références :

1. P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4,

pp. 215-306.

2. Norme ISO 14001.

Terme associé : Etude d’impact

Le glossaire Un concept [fr] :

[label préféré; synonymes; Définitions; Références; termes associés]

label préféré : Impact sur l’environnement

Synonymes : Conséquence sur l’environnement, effet sur l’environnement

Définitions :

1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique d'écosystème.

2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement des activités,

produits ou services d’un organisme.

Références :

1. P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4, pp. 215-306.

2. Norme ISO 14001.

Terme associé : Etude d’impact

Enrichissement

du glossaire

label préféré : Etude d’impact

Synonyme : Etude d’incidence

Définitions :

1. Processus d’identification des conséquences probables pour l’environnement bio-

géophysique, pour la santé de l’homme et pour son bien-être, de la mise en œuvre

de certaines activités et transmission de ces informations aux responsables

capables de sanctionner les propositions.

Références :

1. Wathern (Ed.), 1988, Environmental Impact Assessment: Theory and Practice,

Routledge, London

Terme associé : Impact sur l’environnement

Enrichissement du glossaire

Décomposition des questions :

Quels sont les impacts sur la biodiversité si l'étang de Mauguio s'assèche?

• Quel est le polygone correspondant à l’étang de Mauguio ?

• Quelles sont les espèces observées dans le polygone?

• Parmi les espèces observées, quelles espèces pourraient disparaître s’il y avait assèchement ?

– Rechercher les habitats des espèces observées?

– Sélectionner les espèces observées qui ont pour habitat les zones humides

Polygone Aire formée d'une surface intérieure, d'un anneau extérieur et qui peut comporter plusieurs anneaux intérieurs qui ne se croisent pas ni ne s'imbriquent. Glossaire - Exploring GIS, by Nicholas Chrisman. [Aire]

Etang Etendue d'eau stagnante, peu profonde, de surface inférieure à 8 hectares résultant de l'imperméabilité du sol. Convention de Ramsar, 1971.

Observation

1.Une observation est une action dont le résultat est une estimation de la valeur de certaines propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. SEEgrid,”OGC Standard - Observations and Measurements”

2. Une observation est une affirmation selon laquelle une entité a été observée. Une observation peut consister en des mesures qui se réfèrent à une ou plusieurs caractéristiques de l’entité. Les observations sont effectuées dans un contexte. Le contexte d’une observation se compose d’autres observations. Par exemple, une observation d’un lieu particulier peut servir de cadre pour une observation d’un organisme. Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol2,3,pp 279-296 [Observateur]

Habitat

1. Ensemble de caractéristiques environnementales qui, pour les animaux terrestres, est généralement assimilé à une communauté végétale, une association végétale, ou un type de couverture . Garshelis,2000, Delusions in habitat Evaluation: Measuring Use, Selection, and Importance in Research techniques in animal ecology

2. Lieu ou type de site dans lequel un organisme ou une population existe à l'état naturel. Convention sur la diversité biologique, 1992.

Zone humide 1. terrains, exploités ou non, habituellement inondés ou gorgés d'eau douce […] Article 2 de la loi du 3 janvier 1992 Codifié à l'article L 211-1 du code de l'environnement. 2.les zones humides sont des étendues de marais, de fagnes, de tourbières ou d'eaux naturelles ou artificielles […] Article 1.1 Convention de Ramsar, 1971.

Définir les termes

Un Wiki pour collaborer

XWiki : un moteur de wiki open source • Edition collaborative via un navigateur Web

view/edit/preview/save

• Edition WYSIWYG

• Gestion des versions

• Gestion des droits

http://www.xwiki.com/

1. Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?

2. Quelles sont les conséquences de l'introduction de la coccinelle orientale, Harmonia axyridis Pallas sur l'écosystème européen?

3. Est-ce que les campagnes entourant Lunel ont un niveau de biodiversité élevée?

4. Quelles sont les méthodes pour évaluer la biodiversité de ma région?

5. Pourquoi malgré son statut d’espèce protégée, l’Esturgeon européen est en train de disparaître?

6. Depuis le début de sa protection en 1979, comment évolue la taille de la population de la genette (Genetta genetta) en France?

7. Quel est l'impact de la mise en place d’une aire de stationnement de poids lourds, au niveau de l’aire d’autoroute de Vidauban ?

8. Le fauchage en juin n’est-il pas un puits écologique pour la biodiversité pour mon pâturage, en Auvergne, Marcenat ?

9. Pourquoi je ne vois plus de chouettes lorsque je me balade en Camargue?

10. Puis-je observer des Bouquetins dans le Parc National des Ecrins?

11. Quels sont les impacts sur la biodiversité s'il n'y a plus de paturage dans les montagnes alpines?

12. Combien d'espèces en danger y a-t-il autour de ma zone?

13. Comment pouvons nous atteindre l'objectif de la CDB (Convention sur la diversité biologique) dans l'aire méditerranéenne de protéger 10% desécorégions du monde ?

14. Comment délimiter le territoire du futur Parc National en forêt feuillus de plaine (entre Champagne et Bourgogne) ?

15. Comment délimiter le cœur de parc du futur Parc National des calanques ?

16. Quels terrains sont prioritaires à l'achat pour le Conservatoire du Littoral en region PACA ?

17. Quels terrains sont prioritaires à l'achat par la "CDC Biodiversité" pour la protection du Coussoul de Craux?

18. Quelle est l'évolution de la taille de la population des insectes pollinisateurs dans la plaine de Beauce depuis les révolutions agricoles?

19. Combien d'observations sont présentes dans la zone sélectionnées?

20. Combien d'individus de l'espèce X ont été vus sur la zone Y ?

21. Quels sont les principaux protocoles d'échantillonnage pour estimer la taille d'une population/densité d'une population d'oiseaux ?

22. Quelles est la taille, la forme et le nombre de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ?

23. Quelle est la précision et l'exactitude de ce jeu de données ?

24. Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?

25. Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?

26. Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élévé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?

27. Quelles étaient les valeurs des variables d'environnement pour cet échantillon ?

28. Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?

29. Existe-t-il des modèles numériques de terrain disponibles pour l'aire d'étude ?

30. Existe-t-il des images rasters disponibles pour l'aire d'étude ?

31. Quelles sont les differentes categories d'Aires Protegées?

32. Comment pouvons-nous sauvegarder l'agrobiodiversité des bananes cultivées dans le contexte de la mondialisation?

33. Quels sont les principaux services écosystémiques fournis par les habitats humides de Camargue ?

35 questions [fr- en] Politiques

Scientifiques

Locales

~100 termes définis

Glossary for exploring GIS by Nicholas Chrismas

Glossary of the Federal Geographic Data Committee

Glossary of the Great Lakes Environmental Indicators Project

Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO

Glossary of statistical terms, Organization for economic co-operation and development

OceanLink’s Glossary of Common Terms and Definitions in Marine Biology

International Code of Zoological Nomenclature 1999

Larousse

Wiktionary

Références

bibliographiques

Glossaires

Dictionnaires

Etude des standards

Dublin Core EML

Darwin Core

ABCD schema Taxon Concept Schema

GML ISO 19115

Standards de

métadonnées

Standards de données

de biodiversité

Standards de données

géographiques

Les ontologies en biodiversité

ALTER-Net Ontologies (SERONTO) Amphibien taxonomy Basis Formal Ontology Biological Taxonomy Vocabulary Biotop Cereal plant trait< Crop ontology Darwin-SW DOLCE Environment Ontology Extensible Observation Ontology Fly taxonomy Gazetteer Ontology GeoConcepts Ontology Geonames

geo OWL

geoSpecies ontology

INSEE ontology

NCBI organismal classification

OBO relationship types

ontology of geographical region (from UMLS)

Ordnance Survey Ontologies

Plant environmental conditions

Spire: ethan ontology

SUMO

Sweet ontologies

Taxonomic rank vocabulary

Taxon concept ontology

Taxonomy Ontology

Teleost taxonomy

Wildlife Ontology (BBC)

30 ontologies de

domaine

Biologie 17

Géographie 11

Haut niveau 4

OWL 16

OBO 12

RDFS 2

Construction de l’ontologie

Domaine « Observations » « Action dont le résultat est une estimation de la valeur de certaines

propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. » OGC

• Collecte de données

• Méthodes d’échantillonnage

• Identification

• Préparation de la collecte (recherche d’information cartographique, par exemple)

• Données collectées

~30 termes du glossaire

Accuracy (ABCD)

Identification (ABCD)

Taxon (DwC)

Observation (GML)

Polygon (GML)

Dans les Standards ?

Top

domaine

ontologie

Standards en

biodiversité

Concepts

environnementaux

Top domaine ontologie

• OBOE, extensible Observational ontology

• Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge)

• LTER : Long Term Ecological Research (US)

• http://seek.ecoinformatics.org.

• Madin et al, 2007

OBOE-core

Une entité peut être observée dans le

contexte de plusieurs entités

un individu peut être observé dans

le contexte d’un habitat et d’une date.

Les caractéristiques observées sont

mesurées suivant un protocole et un

standard.

Taille en cm

Extension OBOE core

Les points d’extension : • Entity

• Characteristic

• Measurement

Classification des concepts définis suivant les points d’extension

Modélisation des propriétés et classes supplémentaires

Les concepts

Entity Characteristic Measurement

Sample Population Polygon Quadrat Transect Individu

Date Area PopulationSize PopulationDensity SpatialPattern Criteria EnvironnementalVariable

SamplingProtocol Identification

Les ressources externes

• Wgs84_pos geo:lat geo:long geo:alt

• Dublin core dc:Location

• Foaf foaf:person

• Taxon concept txn:speciesConcept

txn:hasGBIF

txn: hasEOL

Measurement

Entity

Knowledge

ecoOnto

• Réflexion sur les concepts

• Etat de l’art sur les standards, les ontologies, les technologies

• Ontologie pas vraiment aboutie

– Rôle de NS ? Du comité scientifique ?

– Fin de projet

– Pas de validation des acteurs du domaine

ecoQuery

Extraire et exploiter

les données de

biodiversité

2010 2011 2012 2013

glossary ecoOnto-Med

Etude de la faisabilité du système ECO-INC

Quelles sont les

zones à protéger

en PACA?

Observations à

collecter pour répondre

à la question

Proposition de

zones à

protéger en

PACA

ecoRelevé Knowledge

Module de connaissances

Module de données

Recherche

des données

existantes

Etude de la faisabilité du système

Quelles sont les

zones à protéger

en PACA?

Observations à

collecter pour répondre

à la question

Proposition de

zones à

protéger en

PACA

ecoRelevé Knowledge

Module de connaissances

Module de données

Recherche

des données

existantes

LOD

Web de données et biodiversité +200 jeux de données 40 en biologie/15 en géographie

Des bonnes pratiques Identification des éléments par des URI Utilisation d'URI HTTP déréférençables Fournir des informations lisibles par les humains et les machines Ajouter des URI externes

http://datahub.io/dataset//

La plateforme ecoRelevé

http://naturalsolutions.github.io/ecoReleve/

ecoRelevé

Core Explorer

Data

Espèces

Temps

Localisation

Service

Web

La plateforme ecoRelevé

http://naturalsolutions.github.io/ecoReleve/

ecoRelevé Knowlege

Core Explorer

Data

Ontologie

Sparql

Service

Web

Espèces

Temps

Localisation

Étude de l’impact sur l’avifaune de la

restructuration des dispositifs de

protection contre les crues

Sénas - Cheval Blanc

Cas d’utilisation

Collecte de données (web, terrain)

• Occurrence des taxons

• Statut de protection

Détermination de l'importance du site pour l'avifaune

Démarche

Recherche des données

Web

Inventaire de l’avifaune

GeoNames : Communes de Cheval Blanc

Taxon Concepts : Occurrence d’espèces

Taxon Concepts : Dates

RDFization des

données de l’Avian

Knowledge Network

http://www.avianknowledge.net/

6 taxons

Inventaire de l’avifaune Collecte des données

Terrain 17 taxons

Import dans ecoRelevé Data

Acrocephalus

arundinaceus

(Linnaeus, 1758)

Rousserolle

turdoïde

Enrichissement

DBpedia

- statuts IUCN

- photos

Inventaire de l’avifaune

Enrichissement

GeoNames : Département du Vaucluse

AKN : occurrences

Dbpedia : statuts, photos

49 taxons

Utilisation des technologies du Web

Sémantique pour intégrer des données de

biodiversité

Mise à disposition de ces technologies pour

les acteurs de la biodiversité

Etude de la faisabilité du système

Bémol

Faible volume d’observations disponibles dans le LOD

Utilisation de l’ontologie de la biodiversité pour intégrer plus de données !

ecoOnto

Module de données

Et la suite ?

Les acteurs du domaine pas prêts pour accueillir ces nouvelles technologies

• Besoin de définir les concepts du domaine

• Besoin d’outils pour définir ces concepts et pour les utiliser

2 Projets

• ecoOnto-Med

• ecoRelevé glossary

ecoOnto-Med

Glossaire en ligne

trilingue pour un

développement durable

en Méditerranée

2010 2011 2012 2013

glossary ecoOnto-Med

ecoOnto-Med

Résoudre les problèmes d’interprétation et de traduction des connaissances scientifiques sur la biodiversité dans les pays arabophone

Glossaire trilingue (Français/Anglais/Arabe) de la biodiversité en Méditerranée

Besoins Etablir un glossaire Anglais – Français – Arabe

[Terme préféré – Définition – Références - Synonymes – Termes reliés]

Editable en ligne dans toute les langues (avec prise en compte de l’écriture droite-vers-gauche)

Mettre en place un workflow collaboratif d’édition des termes

Rédaction/Traduction/Validation

MediaWiki

Un moteur de Wiki open source

Wikipedia, Wikitionary, Wikimedia Commons (+4000 services)

• Ajouter, modifier, supprimer les contenus via un

navigateur

• Edition collaborative avec prise en compte de l’écriture droite-vers-gauche

• Gestion des droits

ecoOnto-Med

http://ecoonto.cmimarseille.org/

~150 concepts Blondel J., Aronson J., Bodiou J.Y. and Boeuf G. (2010); The Mediterranean

region: biological diversity in space and time

Edition via des formulaires

ecoOnto-Med

Sur les traces du projet ecoOnto … • Un glossaire de la biodiversité • Une édition collaborative

• Pas de relation en les termes • Pas d’utilisation de standards existants

Vers le web sémantique…

ecoRelevé Glossary

Un éditeur de

vocabulaires

contrôlés

2010 2011 2012 2013

glossary ecoOnto-Med

Gestion des données de biodiversité

Données de biodiversité

Annotation • Ajouter du sens auX

données

• Domaines de valeurs

• Design de protocoles

• Communication

Controlled vocabularies

Controlled vocabularies Vocabulaires

contrôlés

Données de Biodiv

Vocabulaires contrôlés

Communication

Données de Biodiv

Vocabulaires contrôlés

Communication

Données de Biodiv

Vocabulaires contrôlés

Communication

Communication

Données de Biodiv

Vocabulaires contrôlés

Besoins

Accompagner le

changement pour

interopérer avec le

monde Données de biodiversité

Controlled vocabularies

Controlled vocabularies Vocabulaires

contrôlés

Solution

Editeur de

vocabulaires

souscription

Extrait de

vocabulaires

extract

Données de biodiversité

Controlled vocabularies

Controlled vocabularies Vocabulaires

contrôlés

Solution

Editeur de

vocabulaire

souscription

Interopérabilité

Editeur de vocabulaires

Besoins • Web

• Open source

• Edition collaborative

• Gestion des versions

• Fédérer une communauté

• Importer and réutiliser des vocabulaires existants

• Compatible avec les technologies du sémantique Web

Extension de Semantic MediaWiki

Semantic MediaWiki

Une extension de MediaWiki ajoutant des

annotations semantiques

• Ajouter des propriétés à aux pages

• Interroger de manière sémantique

• Importer and réutiliser vocabulaires

• Exporter en RDF

ecoRelevé Glossary

Import des vocabulaires

•SKOS

•Dubin Core

•Bibo

•RDF/RDFS

1 page = 1 concept • URI déréférencées

• Propriétés extraites des vocabulaires pour

décrire les concepts

Glossary:concept

dcterms:identifier

skos:prefLabel

skos:altLabel

skos:definition

skos:exactMatch

bibo:document

Hiérarchie simple

Glossary:concept

rdf:type

skos:broader/skos:narrower

skos:hasTopConcept

Glossary:concept

Glossary:concept

Glossary:topConcept

Glossary:category

Fonctionnalités spécifiques

• Gestion des références

bibliographiques

• Navigation via fil d’ariane

• Import de vocabulaires SKOS

L’interface

Le connecteur Comment utiliser ces vocabulaires pour annoter les

données ?

1. Définir une thésaurus via la page de souscription

2. Un thesaurus = une requête sémantique à partir du glossaire

• un ensemble de concepts

• un ensemble de propriétés

3. Souscrire à ce thésaurus via la page des préférences utilisateur

4. Appeler ce thésaurus

• via le web

• via un client glossary

5. Voir les logs des événements à partir du menu utilisateur

• Initialisation

• Mise à jour

Définir le thésaurus

Souscrire

Client Glossary

Biodiversity data

Controlled vocabularies

Controlled vocabularies

Controlled vocabularies

ecoRelevé -

Glossary

getData Client Glossary

Gestion de la souscription

Logs

Export du Thésaurus/logs

Connexion à mon système

Une solution non

intrusive pour se

connecter au monde !

ecoRelevé Glossary

Un système de gestion de vocabulaires

Une solution pour se connecter aux vocabulaires

En développement !

Besoin de sensibiliser les acteurs du domaine à

l’annotation dans le contexte du partage de données

http://ecoreleveglossary.natural-solutions.eu/

Conclusion

Acteurs du domaine prêts

Données disponibles ***** • EOL

• GBIF

• wikidata

• …

Outil d’exploration • Datahub

Outil d’annotation sémantique • ecoRelevé Glossary

Recommended