43
BCM 2003 Département de biochimie et médecine moléculaire Matthieu Ruiz, Ph.D., Laboratoire de métabolomique dirigé par le Pr. Christine des Rosiers, Centre de Recherche de l’institut de cardiologie de Montréal Partie 1:

LA MÉTABOLOMIQUE - Université de Montréal - ESIdbcm2003/metabolomique/Cours/coursH1… · d’un point de vue clinique pour la détection spécifique de maladies ... (normalité

  • Upload
    ledan

  • View
    224

  • Download
    0

Embed Size (px)

Citation preview

BCM 2003

Département de biochimie et médecine

moléculaire

Matthieu Ruiz, Ph.D., Laboratoire de métabolomique dirigé par le Pr. Christine des

Rosiers, Centre de Recherche de l’institut de cardiologie de Montréal

Partie 1:

2 parties : notions générales et applications

Familiarisation avec la théorie sous-jacente à la métabolomique.

Du pourquoi? … au comment?

Cours 1:

Cours 2:

Introduction générale: la métabolomique à l’échelle de l’ome

Notions de base et apercu général des applications

Flux de travail, approche ciblée vs. non ciblée

Les défis d’une analyse métabolomique

Applications diverses, ciblées et non ciblées

Perspectives futures et nouvelles applications

Une science jeune qui a de l’avenir…

Mise en contexte…

The’omes puzzle, Moya Baker, nature 2013

Vers une approche holistique, c’est à dire que l’on considère un ensemble

d’éléments: “-omes” et on cherche les structures de ces ensembles:

“-omiques”.

Vient en opposition d’une approche descriptive et réductionniste

où l’on ne considère qu’un élément isolé.

Holisme, du grec ancien “hólos” pour entier.

“tenter d’expliquer un phénomène comme étant un ensemble indivisible

puisque la somme de simples parties ne suffit pas à le définir”

Description d’un système complexe avec des caractéristiques ciblées et réductrices

D’une approche réductionniste…

Description d’un système complexe avec des caractéristiques illimitées et

inattendues

Vers une approche holistique…

Approche hollistique en biologie

Ivanisevic J et al, 2015

Dernière pièce du puzzle

Le dogme central de la biologie moléculaire

“Metabolomics reveal changes that take

place as a net result of interactions

between the genome and the

environment and as such bridges the gap

between genotype and phenotype”

Génomique/

Transcriptomique Protéomique Métabolomique

≈ 40 000 gènes ≈ 106 protéines ≈ 20 000 métabolites

Image de l’état fonctionnel

du génome

Mesure de 100 à plusieurs milliers de variables (haut débit)

- Analyse en série

(SAGE)

- Puce à ADN

- Profil d’expression

- Electrophorèse 2D

- Spectrométrie de

masse

- Chromatographie…

Mature “En croissance”

- Spectrométrie de

masse (GC-MS, LC-

MS).

- Ciblée vs. non ciblée

C2-Car

C3 DC-Car

C3-CarC4-Car

C6-Car

d3 C8-Car

C16-Car

C18-Car

d3 C12-Car

Sciences “omiques” et notion de haut débit - 2

Une relation complexe entre le génotype et le phénotype - 1…

1 gène 1 protéine

Approches génie génétique:

Inactivation ou surexpression d’un

gène (bactérie ou animal)

Phénotype parfois imprévisible

Maladies génétiques du métabolisme

1 même déficit enzymatique

Plusieurs phénotypes cliniques

Sous-entend qu’un gène va avoir un seul impact sur une étape unique d’une seule

voie métabolique

“one gene-one enzyme hypothesis”

≈ 40 000 gènes ≈ 106 protéines

Une relation complexe entre le génotype et le phénotype - 2…

Exemple du Syndrome de Leigh version canadienne-française (LSFC)

+ communément: acidose lactique

Syndrome décrit en 1993 par Morin & coll. comme une forme d’acidose

lactique spécifique au Saguenay-Lac-St-Jean

Clinique

Retard psychomoteur

Dysmorphie faciale

Hypotonie

Stéatose hépatique

Lésions cerveau

Episodes d’acidose

sévère (crises)→

hospitalisation → haut

taux de mortalité

Génétique

Monogénique

Gène causal

(2p21) en 2001

LRPPRC (2003)

homozygote

(A354V) ou

hétérozygote

(C1277STOP)

Biochimique

Acidose lactique

Défaut de COX

(complexe 4),

chaine respiratoire

mitochondriale

Activité altérée foie

et cerveau (↘80-90%) et fibroblastes

(-50%)

Métabolisme

“A metabolic

signature (45

metabolites) of

mitochondrial

dysfunction

revealed through a

monogenic form

of LSFC”

Thompson L J et al, 2015

La réponse métabolomique est “time-sensitive”…

Temps

Rép

on

se

Rép

on

se

Rép

on

se

Cest une réponse

dynamique

→ La concentration

des métabolites peut

varier très

rapidement (en s)

→ variation

dépendante de

nombreux facteurs

Une description

métabolomique

détaillée, renseigne sur

les perturbations du

phénotype et relie ce

dernier à un processus

en amont en réponse à

un évènement

(génétique,

pathologique…) à un

temps t bien défini.

Stress

Nutrition Pathologie

Rythme biologique Hormones

Médicaments

Mutation génétique

La fluxomique, une dimension dynamique de la métabolomique

Fluxomique = analyse de flux métabolomique

C’est une approche dynamique de la métabolomique. Vient en opposition à des

mesures statiques (quantification).

Utilisation de substrats

marqués pour sonder

la dynamique du

métabolisme

Définitions et concepts essentiels…

Quelques définitions utiles…

MÉTABOLITE

Représente l’ensemble

des métabolites

MÉTABOLOME

Représente un composé organique

intermédiaire ou issu du métabolisme et est

restrictif aux molécules de petites taille (<1500

Da)

N.B. Dalton = unité de masse atomique

Détection dans

divers tissus ou

fluides (sang,

plasma, urine,

salive…)

M

É

T

A

B

O

L

O

M

I

Q

U

E

Identification et

quantification

exhaustives et non

sélectives de l’ensemble

des métabolites d’un

système biologique,

lesquels sont issus des

processus de

transformation du

métabolisme

Fiehn O. et al, Nat. Biotech, 2000

0

500

1000

1500

2000

2500

3000

3500

2 19 41 68 120 180 269 400

600

918 1125

1434

1887

2150

2816

3127

La métabolomique, une science en expansion

Pas plus de 100

métabolites détectés.

Surtout dépistage de

maladies génétiques

du métabolisme

Profilage métabolique

Une science d’avenir génératrice de

nouvelles hypothèses

897 en 2016 (au 14.03.16)

Des exemples concrets de métabolites chez l’humain

Répertoriés dans diverses bases de

données dont la plus représentative est

Human metabolome Database

(www.hmbd.ca)

Inclue de nombreuses petites

molécules: sucres, molécules

organiques, lipides,

oligonucléotides, acides

aminés…

Non exhaustif, en évolution…

Métabolomique, émergence fin des années 1990…

Tiré de: Canadian Bioinformatics Workshop

www,bioinformatics.ca (2013)

Vue d’ensemble au sein des réactions du métabolisme

Carte globale des voies métaboliques

Lipides Sucres Acide aminés

Métabolisme énergétique

Nucléotides

Petites molécules

La métabolomique: “the final frontier” ?

Découverte de

biomarqueurs*2

Études

toxicologiques

Études effets/toxicité

médicamenteuse

Nutrition

Identification

maladies

métaboliques

héréditaires*1

Contrôle succès

ou échec greffe

Veenstra TD et al, Genome Medicine, 2012

Outil diagnostique dans le cadre des pathologies héréditaires du métabolisme

Profil métabolomique utilisé pour le diagnostic néonatal de pathologies héréditaires du

métabolisme, en routine

L’apparition d’outils de détection de plus en plus performants a été révolutionnaire

d’un point de vue clinique pour la détection spécifique de maladies génétiques

Urine Sang

Acide-gras (AG) très longue

chaine (peroxisomes)

Syndrome de Zellweger

Acylcarnitines

Déficience oxydation des AG

(mitochondries)

Entre C6 et C10 MCADD

C14:1, C14, C14:2 VLCADD

Rinaldo P et al, Genet med, 2008

C16, C18, C18:1 CPTIID

Acide aminés branchés

“Maladie du sirop d’érable”

Recherche de biomarqueurs-1, exemple du cancer

2009

Sreekumar A et al, nature, 2009

Cernei N et al, Int.J.Mol.Sci., 2013

Concentration élevée dans urine (+

tissus). Identifié comme marqueur de

la progression du cancer de la prostate

GNMT=glycine N-

methyltransferase

Recherche de biomarqueurs-2, exemple du diabète

2011

Wang TJ et al, nature medicine, 2011

BCAA: Leucine,

isoleucine, valine

Aromatic AA: Tyrosine,

phenylalanine

Com

bin

ed s

core

Combined score

HO

MA

-IR

Chen T et al, scientific reports, 2016

Approche ciblée vs. non ciblée

Flux de travail général

Identification du

contexte biologique et

choix du compartiment

Préparation de

l’échantillon

Extraction

Conservation

Collection

Acquisition des données

Appareillage

Spectres de masse

m/z ratio

Inte

nsity

Traitement des données

dataset

Listes RT,

m/z,

intensité …

Analyses statistiques

Multivariées

Univariées

Identification, Validation

MS/MS

Bases de données

Signification biologique

Littérature

Bases de données

QC and validation methods

Choix de la technologie - 1. Spectrométrie de masse vs. RMN - 1

Résonance magnétique nucléaire Spectrométrie de masse

On utilise la capacité d’absorbtion/relaxation

(ou résonance) des noyaux atomiques soumis à

un champs électromagnétique

Détection et identification selon la masse et la

charge d’une molécule au préalable ionisée et

caractérisé par une intensité relative

Soit utilisé seule (“shot gun”) soit après

séparation par chromatographie gazeuse

(GC) ou liquide (LC) Non sélectif, rapide, peu ou pas de

préparation d’échantillon. Info sur

structure chimique. Meilleure sensibilité, préparation

échantillon plus complexe

Choix de la technologie - 1. Spectrométrie de masse vs. RMN - 2

ng/ml

μg/ml

pg/ml

Composés

concentration élevée

Composés faible

concentration

Préparation générique

des échantillons

Préparation ciblée des

échantillons

RMN

Spectrométrie de

masse

Nouvelles

générations GC-

MS, LC-MS

acide organiques

lipides

acide aminés

nucléotides

stéroïdes

eicosanoïdes

neurotransmetteurs

peptides

Traces…

Choix de la technologie – 2. GC- ou LC-MS

Moins polaire Plus polaire

MS = mass spectrometry; GC = gaz chromatography; LC = liquid chromatography

Un compromis analytique entre qualité et quantité

Adapté de: Threthewey 2004)

Analyse ciblée: plusieurs composés

d’une seule classe

Nom

bre

de m

éta

bo

lite

s

Analyse ciblée: un métabolite

Analyse non-ciblée: métabolites non

identifiés; profil complexe

Qualité des données

(quantification, précision, sensibilité, identité)

Le métabolome ~20,000 métabolites

Analyse ciblée: plusieurs classes

de métabolites; profil complexe

Métabolomique

Métabolite unique

Profilage

métabolique

Empreinte

métabolique

2 approches distinctes: ciblée vs. non ciblée

Approche

ciblée

Approche

non ciblée

Grand nombre de métabolites (le

plus possible) en simultanné

Approche génératrice

d’hypothèses, découverte

Méthode exploratoire, non

quantitative

Complexité d’analyse et de

traitement de données

Quoiqu’il en soit importance

validation et standardisation

en amont

Nombre de métabolites limité,

souvent métabolites connus,

prédéfinis

Pour répondre à une hypothèse

ou outil diagnostique

Méthode quantitative (ou semi)

Précision et reproductibilité

L’approche ciblée: principe

C2-Car

C3 DC-Car

C3-CarC4-Car

C6-Car

d3 C8-Car

C16-Car

C18-Car

d3 C12-Car

Acquisition des données

1 métabolite est défini par 1

m/z et 1 RT

Analyse des données

Analyses statistiques

Inte

nsité

RT

Liste métabolites avec RT,

m/z (caractéristiques)

Intensité (aire sous la courbe) des

pics caractéristiques

Contrôle qualité

Calcul concentrations

(ratio/standard)

Diverses analyses envisageables dépendament

de l’objectif :

univariée/multivariée, supervisée/non supervisée

Corrélations, analyse de covariance

Métabolites analysés sont préalablement connus;

Échantillons additionnés d’un ou plusieurs standards externes ou internes

Adapté de Roberts LD et al, curr protoc mol biol, 2012

L’approche non ciblée: principe

Acquisition des données

1 métabolite est défini

par 1 m/z et 1 RT

Inte

nsité

RT

Analyse des données

Analyses statistiques identification

Traitement “raw data”

“Peak picking” ou extraction des

pics

Alignement des RT

Liste “entités” : RT, m/z, intensité

Filtre de fréquence : exclusion si un

“feature” sous-représenté

Imputation des valeurs manquantes

sur la base d’une “entité” similaire

Liste identités exprimés

différentiellement + m/z

Volcano plot

PCA

Base de donnée

(METLIN, hmp)+Analyse

MS/MS (ciblée)

Interprétation bio.

Adapté de Alonso A et al, frontiers in bioengineering and biotech, 2015 “pathway analysis”

“databases” utiles pour l’analyse des données …

Alonso A et al, frontiers in bioengineering and biotech, 2015

Update 3.0, Xia J et al, nucleic acid

research, 2015

“databases” utiles pour l’identification d’entités, de métabolites…

Alonso A et al, frontiers in bioengineering and biotech, 2015

+ validation des familles de métabolites clés

par MS/MS

“databases” utiles pour l’interprétation biologique…

Alonso A et al, frontiers in bioengineering and biotech, 2015

+ Une bonne dose de littérature!!

Généralement à l’origine de nouvelles hypothèses et permettant de nouvelles avenues de

recherche

Approches statistiques et de visualisation

+ Volcano plot, largement

utilisé pour les sciences

omiques.

Approches statistiques Approche de visualisation

dif entre 2 groupes ou plus

(normalité vérifiée, test

d’homogénéité des variances)

Permet une simplification d’un large set de données

complexes. Efficace pour sélectionner/détecter une liste de

composés différentiellement exprimés entre 2 conditions

expérimentales

On veut s’affranchir de

l’impact de facteurs

confondants

Analyse de covariance

Focus sur le volcano plot

+ Volcano plot, largement utilisé pour les sciences omiques pour

l’identification rapide de changements entre 2 conditions (surtout avec très

grand “dataset”)

Hur M et al, Nat Prod Rep, 2013

Focus sur l’analyse de composantes principales (ACP) - 1

1. Quelle est l’image qui va représenter le plus l’objet en question?

Associé à un algorithme

mathématique

Information visuelle la plus grande

2 axes (vecteurs)

représentant la plus

grande étendue

(perpendiculaire)

PC1

PC2

2. Simplification d’un objet 3D (réel) en représentation 2D (plan)

Concrètement, méthode dite d’ordination permettant de dégager les grands

axes caractéristiques d’un objet. Représentation sur des axes.

Focus sur l’analyse de composantes principales (ACP) - 2

On réduit le nombre de variables (la dimensionnalité) d’un jeu de donné tout en

conservant le plus possible la variance de ce jeu de donné

3 variables initiales : 3

gènes réduites en 2

“nouvelles variables”

appelées composantes

principales.

Les PCs obtenus sont représentées graphiquement selon 2 axes expliquant la

plus grande variance. PC1 représente la plus grande variance du jeu de

donnés. PC2 représente la plus grande variance restante et s’illustre

orthogonalement à PC1.

Considérations pratiques et design expérimental…

Gestion massive de données (surtout lors d’une approche non ciblée)

(Fiehn et al. JBC 2011)

Bases de données

Méthodes statistiques

Logiciels et outils de bioinformatique

Qualité de l’échantillon et contrôle qualité

Collecte et entreposage des échantillons Devis expérimental

4oC Contrôle des conditions: statut

nutritionnel et physiologique,

traitement, exercice/sédentaire,

sexe, âge… Immédiatement

-80oC

Niveaux métabolites changent très rapidement,

variable selon de nombreuses conditions

Il est capital d’établir un devis expérimental cohérent et de s’assurer de

la qualité des échantillons

Rappel

Puis pour plus long

terme

Facteurs confondants -1, sexe et âge

Précautions à prendre dépendemment du compartiment considéré