1
Algorithmique pour les Peptides Non Ribosomiques Par Yoann Dufresne, sous la direction de Maude Pupin et Laurent Noé au sein du laboratoire CRIStAL (Lille 1) - Financement ministériel Contexte de la thèse Bilan Problématiques informatiques Recherche de composition des NRP : - Comment déduire la structure monomérique produite par la cellule de la structure atomique obtenue expérimentalement ? - Cela revient à chercher où sont les briques de base qui composent un peptide représenté sous la forme d'une structure chimique Inférence des voies de synthése par reconstitution de synthétases : - Quels sont les domaines protéiques nécessaires à la synthèse d'un peptide donné ? - Quelles synthétases réelles produisent ce peptide ? Théorie des graphes Les graphes sont des outils mathématiques permettant de représenter des données sous forme de noeuds liés par des arêtes. La représentation sous forme de graphe permet de manipuler les données avec des méthodes standard et d'en extraire de l'information. Par exemple, on peut chercher à voir si deux jeux de données sont similaires en comparant les graphes les représentant. Dans mon cas, je représente les molécules sous forme de graphes labellés. Vous aurez sans doute remarqué qu'il n'est déjà pas simple de trouver à l'oeil nu rapidement la forme recherchée dans la figure de gauche. Ma problématique est encore plus complexe car je dois chercher plus de 500 monomères (patterns) constitués de plusieurs dizaines de noeuds à l'intérieur de graphes de plusieurs centaines de noeuds. Pour que le code produit soit utilisable, il est nécessaire que j'effectue toutes ces opérations automatiquement en quelques secondes maximum. Domaines protéiques ... TCAATCACGGCCGATGCGCCAACGCTGCGCTTC ... TCAATCACGGCCGATGCGCCAACGCTGCGCTTCTCAATCACGGCCGATGCGCCAACGCTGCGCTTC ... ADN (génome) Bactérie ou champignon Production de protéines appelées synthétases depuis l'ADN Création d'un peptide (NRP) à partir des monomères capturés 1- 3- Extraction puis analyse des composés produits par les bactéries Second objectif de thèse : Prédire les Protéines ayant conduit à la synthèse du NRP. Permet de mieux comprendre les voies de synthèse. Activité des peptides produits. 4- Monomères (briques de bases) Captation dans l'environement des briques de base 2- Premier objectif de thèse : Retrouver les constituants des peptides extraits Permet par comparaison avec d'autres NRP de prédire les activités - Antibiotiques - Anti-tumeurs - Sidérophores ... Défi : Trouvez les 3 occurences du pattern ci-dessus dans la figure ci-dessous Un peu de biologie Compétences acquises Générales - Gestion de projets : Théorie et programmation - Autonomie : Autocritique du travail et des résultats - Communication scientifique : Rédaction, esprit de synthèse et rigueur Scientifiques - Notions biologique : Peptides non ribosomiques et analyse de séquences - Théorie des graphes : Comparaison de graphes Conclusion et perspectives - Première partie terminée avec un logiciel qui est proche des 100% de réussite sur nos jeux-test en moins d'une seconde par peptide - Écriture d'un article algorithmique sur la technique de recherche - Un article sur les résultats biologiques de la première partie - Début de la seconde partie de ma thèse sur la recherche des synthétases - Déplacement au Danemark pour travailler directement avec mes collaborateurs sur la seconde partie de ma thèse Structure atomique Structure monomérique

Contextedelathèsedoctoriales.cue-lillenorddefrance.fr/fileadmin/fichier/... · 2016. 1. 11. · AlgoAriltghomritihqmuiequpeopuorurlelessPPeeppttiiddeessNNononRibRoisbomosioqumesiques

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Contextedelathèsedoctoriales.cue-lillenorddefrance.fr/fileadmin/fichier/... · 2016. 1. 11. · AlgoAriltghomritihqmuiequpeopuorurlelessPPeeppttiiddeessNNononRibRoisbomosioqumesiques

Algorithmique pour les Peptides Non RibosomiquesAlgorithmique pour les Peptides Non RibosomiquesPar Yoann Dufresne, sous la direction de Maude Pupin et Laurent Noé au sein du laboratoire CRIStAL (Lille 1) - Financement ministériel

Contexte de la thèse

Bilan

Problématiques informatiques

Recherche de composition des NRP :- Comment déduire la structure monomérique produite par la cellule de la structure atomique obtenue expérimentalement ?- Cela revient à chercher où sont les briques de base qui composent un peptide représenté sous la forme d'une structure chimique

Inférence des voies de synthése par reconstitution de synthétases :- Quels sont les domaines protéiques nécessaires à la synthèse d'un peptide donné ?- Quelles synthétases réelles produisent ce peptide ?

Théorie des graphes

Les graphes sont des outilsmathématiques permettant de représenterdes données sous forme de noeuds liéspar des arêtes. La représentation sousforme de graphe permet de manipulerles données avec des méthodes standardet d'en extraire de l'information. Par

exemple, on peut chercher à voir si deux jeux de données sontsimilaires en comparant les graphes les représentant. Dans moncas, je représente les molécules sous forme de graphes labellés.

Vous aurez sans doute remarqué qu'il n'est déjà pas simple detrouver à l'oeil nu rapidement la forme recherchée dans lafigure de gauche.

Ma problématique est encore plus complexe car je doischercher plus de 500 monomères (patterns) constitués deplusieurs dizaines de noeuds à l'intérieur de graphes deplusieurs centaines de noeuds.

Pour que le code produit soit utilisable, il est nécessaire quej'effectue toutes ces opérations automatiquement en quelquessecondes maximum.

Domaines protéiques

... TCAATCACGGCCGATGCGCCAACGCTGCGCTTC ... TCAATCACGGCCGATGCGCCAACGCTGCGCTTCTCAATCACGGCCGATGCGCCAACGCTGCGCTTC ...

ADN (génome)

Bactérie ouchampignon

Production de protéines appeléessynthétases depuis l'ADN

Création d'un peptide (NRP) àpartir des monomères capturés

1-

3-

Extraction puis analysedes composés produitspar les bactéries

Second objectif de thèse :

Prédire les Protéines ayant conduit à lasynthèse du NRP.Permet de mieux comprendre les voies desynthèse.

Activité des peptidesproduits.4-

Monomères(briques de bases)

Captation dans l'environementdes briques de base2-

Premier objectif de thèse :

Retrouver les constituants despeptides extraitsPermet par comparaison avecd'autres NRP de prédire les activités

- Antibiotiques- Anti-tumeurs- Sidérophores...

Défi : Trouvez les 3 occurences du patternci-dessus dans la figure ci-dessous

Un peu de biologie

Compétences acquises

Générales

- Gestion de projets : Théorie et programmation

- Autonomie : Autocritique du travail et des résultats

- Communication scientifique : Rédaction, esprit de synthèse et rigueur

Scientifiques

- Notions biologique : Peptides non ribosomiques et analyse de séquences

- Théorie des graphes : Comparaison de graphes

Conclusion et perspectives

- Première partie terminée avec un logiciel qui est proche des 100% de réussite sur nos jeux-test en

moins d'une seconde par peptide

- Écriture d'un article algorithmique sur la technique de recherche

- Un article sur les résultats biologiques de la première partie

- Début de la seconde partie de ma thèse sur la recherche des synthétases

- Déplacement au Danemark pour travailler directement avec mes collaborateurs sur la seconde partie de

ma thèse

Structureatomique

Structuremonomérique