40
Dr. Florent Barbault, ITODYS (CNRS UMR 7086) QSAR 2D

05 QSAR 2D - dsimb.inserm.frfuchs/M2BI/MM/2009/Drug... · Moment dipolaire, HOMO et LUMO. 4. Descripteurs moléculaire 4.4. Descripteurs 3D ... Ils nécessitent un calcul des fréquences

  • Upload
    vutuyen

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

QSAR 2D

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

Plan1. Introduction2. Historique3. Activité biologique4. Descripteurs moléculaires

4.1. Besoin de descripteurs4.2. Descripteurs 1D4.3. Descripteurs 2D

4.2.1. Topologiques4.2.2. De charges4.2.3. Fragmentaux

4.4. Descripteurs 3D4.4.1. Structuraux4.4.2. Energétiques4.4.3. Electroniques4.4.4. Thermodynamiques

5. Sélection des descripteurs6. Exemples7. Conclusions

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

1. Introduction

QSARQuantitative Structure Activity Relationships 2D et 3D

Contexte :

- Il y a environ 1.500 structures 3D expérimentales pour 150.000 à élucider

- Le nombre des structures 3D des cibles thérapeutiques est limité

- Les cibles les plus intéressantes sont les récepteurs membranaires

- Que faire si l'on n'a pas la structure?

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

1. Introduction

Caféine(stimule le rythme cardiaque)

Théophyline(ralentit le rythme cardiaque)Théobromine

(ralentit le rythme cardiaque)

Il existe une relation forte entre la structure et l'activitéIl existe une relation forte entre la structure et l'activité

1868 : Crum-Brown et Fraser, ''Il existe un lien entre la propriété pharmacologique d'un alkaloide et l'alkylation de l'azote – l'activité physiologique doit être une fonction de la structure chimique''

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

2. Historique

Bichet (1893) :"La toxicité des molécules organiques est inversement proportionnelle à leur solubilité aqueuse"

Meyer (1899) et Overton (1901) :"Il y a une relation linéaire entre l'activité des narcotiques et leur coefficient de partage huile-eau"

Hammett-Burkhardt (1937) : "mise en place d'une équation sur les effets des substituants en série aromatique"

Hansch (1964) : "Première méthode pour corréler l'activité biologique et la structure chimique"

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

1. Introduction

Activité biologique = f(structure)

Le but du QSAR est de générer une équation de type:

Problèmes:- Définir l'activité biologique- Mathématiser une structure chimique- Trouver une fonction qui permette la corrélation- Valider et interpréter le modèle généré

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

3. Activité biologique

EC50?EC90?IC50?IC90?K

i?

KD?

Problème de la qualité de la mesure biologique!II faut impérativement que le mécanisme d'action soit identique (biochimie)

On veut établir la relation suivante:

Activité biologique = f(structure)

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

3. Activité biologique

+

KD=[A ] [B ][AB ]

et Gbind=RTlnKD

Ce qui nous intéresse c'est la force de l'interaction donc ∆G

Il faut prendre le logarithme des concentrations!

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

3. Activité biologique

Pour déterminer si les molécules ont un mécanisme identique on se base surLa similarité moléculaire:

Exemple:

SO2

N

NH2

A

B

SO

N

NH2

A

B

S

N

NH2

A

B

IC50 anti HIV: 0,01µM 0,34 µM 0,43µM

Structure RX : NNRTI

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

3. Activité biologique

Contre exemple:

RTI NNRTI

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

3. Activité biologique

Il faut:

- Au minimum 20 composés (plus mieux)

- Un mécanisme d'action identique

- Une détermination chiffrée pour chaque composé

- Une idée de l'incertitude de la mesure

- Compréhension de la mesure et son impact (in vitro vs in vivo)

- Une variation d'activité sur au moins deux unités de log

- Une similarité structurale

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.1. Besoin de descripteurs

On veut une équation de type y = f(structure)

On va utiliser des données physico-chimiques pour décrire les molécules. Le type de données donne la dimensionnalité du QSAR:

Dimension Méthode

QSAR-1D Activité corrélée avec des données globales (MW, pKa...)

QSAR-2D 1D + activité corrélée avec données strucutrales sans 3D direct

QSAR-3D 2D + activité corrélée avec données 3D des ligands

QSAR-4D 3D + prise en compte de différentes conformations des ligands

QSAR-5D 4D + représentation de l'adaptation structurale de la cible

QSAR-6D 5D + représentation des effets de solvant

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaires

Définition : Un descripteur moléculaire est une valeur qui sert à caractériser numériquement des molécules dans un calcul QSAR/QSPR.

Nombre infini de descripteurs??!!

2D 3D

4.1. Besoin de descripteurs

1D

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.2. Descripteurs 1D

Ils tiennent compte de la nature des atomes et des propriétés physicochimiques de chaque molécules.

Exemples:

- Masse molaire- nombre d'atome de chlore, d'iode, d'oxygène...- nombre de cycles à 6- nombre d'atomes aromatiques- nombre de liaisons...- pKa- logP

Ils sont faciles à calculer.Leurs valeurs sont précises et avec peu d'ambiguïté (sauf logP). ils sont essentiels et interviennent régulièrement dans les modèles.

4. Descripteurs moléculaire

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.1 Descripteurs topologiques

Ils sont liés à la connectivité des molécules. Connectivité?

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.1 Descripteurs topologiques

On représente usuellement les connectivités sous forme de matrice. Dès lors on peut faire de nombreuse opérations pour comparer celles-ci. Exemple de l'algorithme d'Ullman.

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.1 Descripteurs topologiques

algorithme d'Ullman: On cherche la matrice A tel que

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.1 Descripteurs topologiques

Descripteurs plus "sophistiqués" ils n'ont pas forcément un sens chimique évident.Calcul rapideImportant, ils interviennent souvent dans les modèles.

Exemple:

- Kier index- Wiener index- Balaban index- Kier index- Indice de chiralité- ...

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.2 Descripteurs de charges

Charge globale (avec les ions)

Charge partielle d'un atome donné sur une structure

Ils sont moins importants qu'il n'y paraît mais essentiels si on a un mélange de molécules chargées ou non.

Ce sont des descripteurs qui peuvent être calculés plus finement avec des descripteurs 3D.

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux

Descripteurs les plus emblématiques du QSAR.

Exemple: sigma de Hammett et pi de Hansch

On va prendre en compte des propriétés physicochimique de partie de la molécule.

Globalement cela revient à analyser les différences de groupes fonctionnels

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire

σ de Hammett

AX

4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4.Descripteurs moléculaire

π de Hansch

logPΦ−COOH

=logPΦΠCOOHΠcorrection

Avec plusieurs mesures expérimentales on a les Πi

4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.3. Descripteurs électroniques

Charges partielles (avec méthodes quantiques)Moment dipolaire, HOMO et LUMO.

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.1. Descripteurs structuraux

volume de VDW (exact cette fois-ci), surface de VDW, surface de solvatation....

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.1. Descripteurs structuraux

On peut avoir des descripteurs plus difficile à appréhender.

Exemple des Shadow indices: Les molécules sont alignés selon leur axes d'inerties (x: principal puis y et z). Puis la molécule est projeté sur chacun des plans du repère orthonormé (Sxy). Enfin, le descripteur est exprimé en ratio par rapport à la dimension la plus importante de la projection.

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.1. Descripteurs structuraux

L'ensemble des descripteurs structuraux permettent une description détaillée des ligands.

Mais leurs difficultés d'obtentions et leurs précisions sont quelques fois des obstacles à l'élaboration de modèles précis.

Avec un peu d'imagination on peut en inventer autant que l'on veut suivant les variations géométriques que l'on veut faire apparaître.

4.4.2. Descripteurs énergétiques

Energie globale, Evdw, Ehbond,.....

Souvent peu intéressant

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.3. Descripteurs électroniques

Attention: pour rendre compte les électrons il faut simulation QM (semi-empirique ou DFT)

Exemples:- moment dipolaire- E

HOMO et E

LUMO

- ...

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

4. Descripteurs moléculaire4.4. Descripteurs 3D

4.4.3. Descripteurs électroniques

Ils permettent une interprétation physicochimique. Mais, ils sont difficiles à calculer et posent des problèmes de précisions.

4.4.4. Descripteurs thermodynamiques

Ils sont calculés sur la base de la fonction de partition. Ils nécessitent un calcul des fréquences de vibration. Ils sont peu utilisés sauf en QSPR

Exemples:- Enthalpie vibrationnelle- entropie translationnelle, vibrationnelle...- ...

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

5. Sélection des descripteursC'est le problème fondamental du QSAR!

On génère tous (entre 400 et 1000) les descripteurs possible il faut sélectionner ceux qui sont les plus pertinent pour notre modèle.

1ère étape Elimination des descripteurs inintéressant par analyse statistique = ceux qui présente une très faible variance sur l'ensemble des molécules (la valeur du descripteur ne change pas ou peu pour l'ensemble des molécules = donc pas de description).

2ème étapeRégression à choisir parmi différents types

- stepwise régression- multi-linear régression- méthode heuristique- ...

5. Sélection des descripteurs3ème étapeOn calcule une régression linéaire pour chaque descripteur restant. On élimine le descripteurs si:

- test Fisher < 1- r² inférieur à une valeur seuil (paramétrable)- paramètre de Student < 0.1- deux descripteurs ont un r² d'intercorrélation > 0.8

6. Exemples

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

6. ExemplesOn s'intéresse à prédire les temps d'élutions pour des acides aminés et des dérivés d'acides aminés (base ~30 composés)

Logiciel CODESSA (COmprehensive Descriptors for Structural and Statistical Analysis)+ HYPERCHEM (AM1 avec MOPAC) pour descripteurs 3D

Calcul de 460 descripteurs

Corrélation / Sélection des descripteurs / Breaking point

PCA pour éliminer les descripteurs redondants

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

R² = 0.84

Time = 50.94 + 3.69 Rev – 2.40 Þ + 0.059 Szx

Rev : « Reverse Index »

Þ : « Randic Index »

Szx : « ZX Shadow »

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

6. ExemplesOn s'intéresse à une série de 24 composés inhibiteurs d'entrées du VIH-1. La cible d'attaque est la protéine gp41. Même protocole.

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

6. ExemplesChaque descripteur est analysé.

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

7. Conclusions

QSAR 2D

- Outils puissant de drug-design- Facile à mettre en place- Nécessite un jeux de données statistiquement valable- On peut interpréter chimiquement l'équation résultante- Il faut comprendre chimiquement les descripteurs- On ne peut interpréter des régions structurales non-étudiées- Il ne faut sur-interpréter le résultat! Données bio = fragile- Ne pas perdre le sens chimique du QSAR!- Ne pas perdre le sens chimique du QSAR!

Perspective/développement- Méthodes de corrélations : RNA, SVM, AG...- Tests statistiques fiables- Encore plus de descripteurs???- 3D???- Projet Européen Reach

Dr. Florent Barbault, ITODYS (CNRS UMR 7086)

FIN