23
DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse des Organismes aux Stress Environnementaux uipe de Biologie des Populations en Interaction Equipe Informatique de Centre Mise en service d’une interface Mise en service d’une interface Web Web pour la saisie, le stockage et pour la saisie, le stockage et l’interrogation de données l’interrogation de données expérimentales expérimentales Tuteurs de stage : Laurent Lapchin, Roger Boll Informaticien encadrant : Xavier Bernardet

DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Embed Size (px)

Citation preview

Page 1: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

DESS BioInformatiqueMontpellier II Sciences et Techniques du Languedoc

Echantillonnage en cultures de Melon

Aurore Veyrat année 2003-2004

UMR 1112

Réponse des Organismes aux Stress Environnementaux Equipe de Biologie des Populations en Interaction

Equipe Informatique de Centre

Mise en service d’une interface Web Mise en service d’une interface Web pour la saisie, le stockage et l’interrogation pour la saisie, le stockage et l’interrogation

de données expérimentalesde données expérimentales

Tuteurs de stage : Laurent Lapchin, Roger BollInformaticien encadrant : Xavier Bernardet

Page 2: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

CONTEXTE DU PROJETDurabilité de la résistance du melon au puceron Aphis

gossypii

Chez le melon, le gène Vat permet de résister à la colonisation par le puceron Des cas d’installation du puceron sur melon Vat ont été signalés

=> Mesurer l’ampleur de ce phénomène et récupérer les souches résistantes à Vat Echantillonnage 2004:

- 2 types de culture: serre et plein champ - 3 à 4 sites d’observation distants- Sur chaque site 2 parcelles étudiées :

- melon Vat, résistant- melon –Vat, sensible

Page 3: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Objectif du stage BioInformatique

1. Conception et mise en service d’une interface WEB de saisie des données melon

2. Mise en place d’une base sous MySQL pour le stockage des données

3. Débuggage de l’utilitaire de saisie rosier développé en 2003

Page 4: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Cahier des charges de l’interface de saisie

1. Contrôle d’accès à l’interface (serveur) et à la base de données

2. Fiabilité, rapidité et confort de la saisie - Contrôle d’intégrité référentielle des données- Contrôle de vraisemblance

- Absence de données orphelines ou de doublons

3. Développement de modules - d’interrogation et de correction - de mise en forme des données

Audit de la saisie des données 2004

Page 5: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Suivi de colonies Suivi parcellaire

Suivi spatio-temporel d’une colonie à l’échelle d’un foyer

Surface 1/16ème de m²,centrée sur la colonie

Suivi spatio-temporel de l’infestation (?) d’une parcelle

Transect de 8 placettes (1 m²)centré dans la parcelle

La mesure du couvert végétal (1 m²) et le sous-échantillonnage du nombre d’organes (1/16ème

m²) servent à calculer les densités au m²

Le protocole expérimental

Les positions des organes observés dans les foyers et les placettes sont repérées par des coordonnées (x,y)

Page 6: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Les données expérimentalesLes données expérimentales sont des observations en classes visuelles d’abondance sur des organes végétaux (feuilles, apex), ainsi que des comptages d’organes par unité de surface.

Deux types de suivi : de colonie et/ou parcellaire

L’enregistrement des données élémentaires (organe) permet les regroupements aux différentes échelles : organe, foyer, placette, parcelle, zone culturale…

On a donc :

N nombre de pucerons/organe

pucerons/type d’organe pucerons/placette (m²)

pucerons/parcelle (m²)

pucerons/foyer

Répété pour chaque date * expérimentation

(313 relevés)

Page 7: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisie

L’administrateur de données délivre un password à l’utilisateur et lui autorise la saisie sur des références d’expérimentation melon uniquement.

Construction du formulaire

Page 8: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisieL’utilisateur construit la grille d’échantillonnage correspondant à l’expérimentation.

Construction du formulaire

La connexion à la base de données nécessite un

password

Page 9: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisie Saisie à partir du formulaire

Le formulaire de saisie correspond à la feuille de terrain et représente tous les organes observés, dans chaque placette. Sélection par bouton radio, les classes visuelles d’abondances sont initialisées à 0.

Page 10: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisie Saisie à partir du formulaire

Page 11: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Administrateur de données

Fichiers de données

Pièce jointe

Oracle

L’utilitaire de saisie Envoi des données

Les données définitivement saisies sont insérées dans les tables MySQL (java, JavaScript), les fichiers .txt correspondant sont envoyés à l’administrateur de données

temporel.txt

organe.txt

spatial.txt

Utilisateur

MySQL

Inra Sophia

Page 12: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisie Affichage des résultats

Histogrammes de fréquence des classes visuelles d’abondance par type d’organes

On peut obtenir l’affichage de 3 dates successives

Page 13: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’utilitaire de saisie Corrections

Un module « corrections » permet l’interrogation et la ressaisie des données erronées (date entière)

Page 14: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

AUDIT DE L’INTERFACE DE SAISIE

3 critères :

Compréhension / Ergonomie

Construction de la feuille de saisie

Validité des données saisies

Page 15: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Compréhension / Ergonomie

AUDIT DE L’INTERFACE DE SAISIE

Cinq techniciens et stagiaires ont saisis 132 relevés parcellaires

Soit 1056 placettes et 22110 observations en classe

+ Peu de questions sur le fonctionnement de l’interface (les utilisateurs ont tous participé aux observations)

- 2 déclarations de saisie de mot de passe par relevé (appels contrôlés en entrée et en sortie à la base de données)

= Confort oculaire mais monotonie inévitable (cause d’erreur)

Page 16: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Construction de la feuille de saisie

13% de feuilles de saisie inexploitables.

Explications :

- Inversion des coordonnées lignes-colonnes : 3 cas ;- Erreur dans les pourcentages de couvert végétal, 1 au lieu de 100% : 2 cas ;- Saisie avec date erronée : 2 cas ;- Confusion dans les coordonnées des placettes : 2 cas ;- Nombre d’organes observés incorrect : 1 cas ;

AUDIT DE L’INTERFACE DE SAISIE

Erreurs imparables de lecture de la feuille de terrain : saisie trop rapide et/ou monotonie de l’opération.

Initialisation automatique des coordonnées des placettes d’une même expérimentation Affichage graphique de la grille avant validation Contrôle des valeurs aberrantes du nombre d’organes observés

Page 17: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Validité des données saisies

AUDIT DE L’INTERFACE DE SAISIE

Échantillon de 19 relevés non nuls, 152 placettes, 3213 observations en classes

Le remplissage direct des feuilles de saisie nécessitait 396 sélections radio bouton (les valeurs initialisées à 0)

0,6% d’erreur globale mais 5% d’erreur de sélection 14/22 erreurs = oublis de saisie (sur 2 relevés chargés)8/22 confusions entre classe d’abondance ou ligne de saisie

Attention particulière aux relevés complexes Utilisation de boutons radio plus espacés Saisie par lecture optique, en cours avec URIH (rosier)

Page 18: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Tableur Application

7 minutes par relevé

Création du formulaire à chaque relevé

Taux global d’erreur 0,6%

Impossible avec l’application Contrôle des doublons à la saisie

Envoi automatique des données à l’administrateur

Affichage des résultats par l’application

Fonction disponible dans l’application

15 minutes par relevé

Masques de saisie modifiables

Taux global d’erreur 5% (D. citrus)

Superpositions de données ou création de dates ou de placettes dues aux copier / coller multiples pour adapter le masque

Gestion des fichiers locale avant insertion dans la base de données

Programmation de macros pour les graphes

Interrogation / correction des données nécessite une interface (Access)

DiscussionAUDIT

laborieux et source d’erreurs

Page 19: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

L’application est actuellement exploitable pour le projet melon, résultats satisfaisant

En accord avec la démarche qualité pour l’acquisition des données expérimentales

Améliorable : écriture d’un module de représentation spatiale

Démonstration d’adaptation générique de l’informatique à une problématique scientifique

CONCLUSIONS

La diversité des travaux réalisés durant ce stage ainsi que la rencontre entre chercheurs et informaticiens s’est révélée très bénéfique pour la mise en place du projet.

Les chercheurs sont très attachés à la feuille de terrain (mémoire physique du relevé).

Page 20: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Préparation de la migration base Oracle vers ProgreSQL

Intégration des procédures de modélisations quantitatives aux interfaces de saisie

Conception d’un système de création d’interfaces : données de terrain ou de laboratoire

Accessible à partir du site Web de l’équipe BPI http://bpi.antibes.inra.fr

PERSPECTIVES

Page 21: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse
Page 22: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

REMERCIEMENTS

Merci à Laurent LAPCHIN, Eric LOMBAERT, Xavier BERNARDET, Stephen AMBROGIO

Merci à toute l’équipe BPI et particulièrement Michèle SALLES et Roger BOLL

Enfin merci à vous pour votre attention

Page 23: DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Aurore Veyrat année 2003-2004 UMR 1112 Réponse

Des données complexes…

Exemple : calcul du nombre de pucerons d’une placette (1 m²)

On a observé 5 feuilles âgées : l’étalonnage nous indique = 28 pucerons/FAOn a observé 5 feuilles jeunes : l’étalonnage nous indique = 7 pucerons/FJOn a observé tous les apex (15): l’étalonnage nous indique = 2 pucerons/AP

D’autre part, le couvert végétal de cette placette est de 70% et les nombres de feuilles âgées et jeunes dans le sous-ensemble de 1/16ème de m² sont respectivement 5 et 10.

Le calcul du nombre de pucerons par placette est le suivant:(28*5*16 *0.70)+(7*10*16*0.7)+(15*2)= 2382 pucerons dans la placette