Transcript
Page 1: Contextedelathèsedoctoriales.cue-lillenorddefrance.fr/fileadmin/fichier/... · 2016. 1. 11. · AlgoAriltghomritihqmuiequpeopuorurlelessPPeeppttiiddeessNNononRibRoisbomosioqumesiques

Algorithmique pour les Peptides Non RibosomiquesAlgorithmique pour les Peptides Non RibosomiquesPar Yoann Dufresne, sous la direction de Maude Pupin et Laurent Noé au sein du laboratoire CRIStAL (Lille 1) - Financement ministériel

Contexte de la thèse

Bilan

Problématiques informatiques

Recherche de composition des NRP :- Comment déduire la structure monomérique produite par la cellule de la structure atomique obtenue expérimentalement ?- Cela revient à chercher où sont les briques de base qui composent un peptide représenté sous la forme d'une structure chimique

Inférence des voies de synthése par reconstitution de synthétases :- Quels sont les domaines protéiques nécessaires à la synthèse d'un peptide donné ?- Quelles synthétases réelles produisent ce peptide ?

Théorie des graphes

Les graphes sont des outilsmathématiques permettant de représenterdes données sous forme de noeuds liéspar des arêtes. La représentation sousforme de graphe permet de manipulerles données avec des méthodes standardet d'en extraire de l'information. Par

exemple, on peut chercher à voir si deux jeux de données sontsimilaires en comparant les graphes les représentant. Dans moncas, je représente les molécules sous forme de graphes labellés.

Vous aurez sans doute remarqué qu'il n'est déjà pas simple detrouver à l'oeil nu rapidement la forme recherchée dans lafigure de gauche.

Ma problématique est encore plus complexe car je doischercher plus de 500 monomères (patterns) constitués deplusieurs dizaines de noeuds à l'intérieur de graphes deplusieurs centaines de noeuds.

Pour que le code produit soit utilisable, il est nécessaire quej'effectue toutes ces opérations automatiquement en quelquessecondes maximum.

Domaines protéiques

... TCAATCACGGCCGATGCGCCAACGCTGCGCTTC ... TCAATCACGGCCGATGCGCCAACGCTGCGCTTCTCAATCACGGCCGATGCGCCAACGCTGCGCTTC ...

ADN (génome)

Bactérie ouchampignon

Production de protéines appeléessynthétases depuis l'ADN

Création d'un peptide (NRP) àpartir des monomères capturés

1-

3-

Extraction puis analysedes composés produitspar les bactéries

Second objectif de thèse :

Prédire les Protéines ayant conduit à lasynthèse du NRP.Permet de mieux comprendre les voies desynthèse.

Activité des peptidesproduits.4-

Monomères(briques de bases)

Captation dans l'environementdes briques de base2-

Premier objectif de thèse :

Retrouver les constituants despeptides extraitsPermet par comparaison avecd'autres NRP de prédire les activités

- Antibiotiques- Anti-tumeurs- Sidérophores...

Défi : Trouvez les 3 occurences du patternci-dessus dans la figure ci-dessous

Un peu de biologie

Compétences acquises

Générales

- Gestion de projets : Théorie et programmation

- Autonomie : Autocritique du travail et des résultats

- Communication scientifique : Rédaction, esprit de synthèse et rigueur

Scientifiques

- Notions biologique : Peptides non ribosomiques et analyse de séquences

- Théorie des graphes : Comparaison de graphes

Conclusion et perspectives

- Première partie terminée avec un logiciel qui est proche des 100% de réussite sur nos jeux-test en

moins d'une seconde par peptide

- Écriture d'un article algorithmique sur la technique de recherche

- Un article sur les résultats biologiques de la première partie

- Début de la seconde partie de ma thèse sur la recherche des synthétases

- Déplacement au Danemark pour travailler directement avec mes collaborateurs sur la seconde partie de

ma thèse

Structureatomique

Structuremonomérique

Recommended