33
Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Embed Size (px)

Citation preview

Page 1: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Méthodes de comparaison entre séquences

multi-échelles végétales

Sylvain DEMEY

Page 2: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Introduction

Séquençage haut débit → forte augmentation des données

Besoin d’outils d’analyses de comparaison Même besoin en biologie végétale au niveau de

l’architecture des plantes Objectifs: implémentation d’un nouvel algorithme de

comparaison entre séquences multi-échelles dans le cadre du logiciel AMAPmod

comparaison de 2 méthodes

Page 3: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

1.Le contexte et le travail demandé

Page 4: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Architecture des plantes

Description d’un individu avec au moins 1 des informations suivantes:

Information géométrique Information topologique décrivant les connections

entre les entités Information de décomposition

entre-noeud

Page 5: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Unité de croissance

Modélisation de l’architecture des plantes

Description arborescente (plus complexe) Description sous la forme de séquences

Exemple de séquence

00 1 0000

0

0

0

0

0

0

1

( )( )( )Multi-échelles

Page 6: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Pourquoi la notion de séquence multi-échelles?

01010101010

01010101010

(0101)(0101010) (0101010)(1010)

Page 7: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les ordres de ramification

ORDRE 1 (Tronc)

ORDRE 2

ORDRE 3

ORDRE 4

Page 8: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Travail demandé

Doit pouvoir s’intégrer dans AMAPmod (dans la librairie Treematching)

Implémentation d’une méthode de comparaison globale

De comparaison locale Algorithme pour la comparaison

d’arborescences appliqué à la comparaison de séquences

Analyses

Page 9: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

2. Algorithmes de comparaison de séquences et implémentation

Page 10: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Algorithmes utilisés et développés

Wagner-Fisher (74): alignement global Smith-Waterman (81): alignement local Selkow (77): méthode de comparaison entre

arborescences (utilisé pour la comparaison de séquences multi-échelles)

Page 11: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Construction des chaînes parenthésées

T1 T2 T3

T= ((001) (0001) (1010)) (

)

) ( ) ( )

)

Page 12: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

La comparaison d’arborescences

T1 T2

insertion de e

substitution de a

substitution de b

délétion de d

substitution de a

Page 13: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les contraintes de l’algorithme de Selkow

Page 14: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les contraintes de l’algorithme de Selkow

Page 15: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les contraintes de l’algorithme de Selkow

Page 16: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Selkow

Algorithme récursif Utilise Wagner-Fisher pour la comparaison

entre sous-arbres Insertion d’un sous-arbre Délétion d’un sous-arbre

Page 17: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Implémentation

Langage C++ Qt pour l’interface R pour les analyses Coût des opérations d’édition:

0 ou 1

Page 18: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Présentation du logiciel

Page 19: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les résultats pour l’alignement global

Page 20: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les résultats pour l’alignement de séquences multi-échelles

Page 21: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Exemple de gestion des load/save

Page 22: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Exemple de gestion des erreurs

Page 23: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

3. Analyses

Page 24: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Modèle théoriqueModèle " simple " :

0 10,50,5 0,5

0,5

Modèle "multi-échelle" 1

0 1

0,40,4 0,4

0,4

0’ 1’

Modèle " multi-échelle " 2

0 10,40,4

0,3

0,3

0’ 1’

0,2

0,50,5

0,5

0,5

0,2

0,3

0,15 0,3

0,15

0,5 0,30,4

0,5

Page 25: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les méthodesWagner-Fisher Selkow

Page 26: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Les exemples choisis

Braeburn Fuji Sur les 5 premiers ordres Chaque ordre 3 types (uc, axil, uc1 axil) Alignement global/Alignement de séquences

multi-échelles

Page 27: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Format des données

Page 28: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Exemple sur l’ordre 1

Wagner-Fisher Selkow

Page 29: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Interprétations sur ordre1

L’ordre 1 → le plus représentatif Bonne séparation mais généralement

meilleure avec Selkow Tjrs à peu près les mêmes intrus sur les 3

types Groupe vaste/groupe compact

Page 30: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Conclusion et perspectives

Page 31: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Conclusion

Implémentation d’une nouvelle méthode de comparaison de séquences multi-échelles

Validation de la méthode par des analyses Séparation suivant les espèces Apprentissage du C/C++, de Qt et du

clustering avec R

Page 32: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

perspectives

Nouvelles matrices d’édition Intégration dans AMAPmod Analyses des résultats des alignements Autre application botanique: validation de

modèles Application dans d’autres domaines: Exemple structure secondaire de l’ARN

Page 33: Méthodes de comparaison entre séquences multi-échelles végétales Sylvain DEMEY

Exemple

Epingle à cheveux (élément de structure secondaire)

On peut représenter cet élément de structure sous la forme de la séquence :

(AAUCC) [AUUGCACUCC] (GGAUU)