Introduction à la génomique structurelle
Nadia El-Mabrouk
Mathieu Lajoie
Rappel – Structure des protéines Structure primaireTIDQWLLKNAKEDAIAELKKAGITSDFYFNAINKAKTVEVNALKNEILK
Structure secondaire
Hélice alpha Feuillet bêta
Rappel – Structure des protéines Structure tertiaire
Conformation d’un seul polypeptide
Rappel – Structure des protéines Structure quaternaire
Plusieurs polypeptides
Classification SCOP
Classes
Folds
Super familles
Familles
All alpha proteinsAll beta proteins Alpha and beta proteins (a/b) Mainly parallel beta sheets (beta-alpha-beta units) Alpha and beta proteins (a+b) Mainly antiparallel beta sheets (segregated alpha and beta regions) Multi-domain proteins (alpha and beta) Folds consisting of two or more domains belonging to different classes Membrane and cell surface proteins and peptides Does not include proteins in the immune system Small proteins Usually dominated by metal ligand, heme, and/or disulfide bridges
Classification SCOPFold: Similarité de structure évidente
Deux protéines ont un repliement (fold) commun si elles ont les mêmes éléments de structure secondaire arrangés de la même façon
N’ont pas nécessairement la même origine évolutive, ni la même fonction.
Classes
Folds
Super familles
Familles
Classification SCOP
Classes
Folds
Super familles
Familles
Super famille: Origine évolutive commune probable
Protéines ayant un faible taux d’identité de séquence, mais dont la structure et la fonction suggèrent une origine évolutive commune
Classification SCOP
Classes
Folds
Super familles
Familles
Famille: Relation évolutive évidente
Identité de séquence supérieure à 30%.
Dans certains cas, de fortes similarités de structure et de fonction permettent d’inclure des protéines ayant un faible taux d’identité de séquence (de l’ordre de 15%)
Pourquoi aligner des structures? Pour des protéines évolutivement éloignées,
la comparaison de séquences ne permet pas d’identifier des similarités de fonction.
Des protéines ayant des séquences complètement différentes peuvent avoir des structures et des fonctions similaires.
Alignement de structures de protéines DALI: Basé sur la comparaison de matrices
de distances 2D. Ces matrices contiennent les distances entre
les carbones alpha à l’intérieur de la protéine. Pour comparer la structure de deux
protéines, on compare leurs matrices de distances 2D.
Exemple
21
3
Mesure de similarité RMSD
Root mean squared distance RMSD Lorsque deux structures sont superposées,
cette mesure est la racine de la somme des distances entre atomes équivalents, au carré.