27
BCM3531: Bio- Informatique

BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Embed Size (px)

Citation preview

Page 1: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

BCM3531: Bio-Informatique

Page 2: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Vos résultats de l’IRIC

Malheureusement l’organisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui vos propres séquences pour ce TP, car vos échantillons ont été apportés à l’IRIC seulement ce matin.

MAIS…

Vous pourrez utiliser vos propres séquences (si votre expérience a fonctionné bien entendu) pour le petit devoir!

Page 3: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Stratégie de mutagénèse

• But du séquençage??

Page 4: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Récupération des séquences sur le site web de la plateforme génomique de l’IRIC

Adresse : www.genomique.iric.ca Sous la section Connexion

Courriel : [email protected] Mot de passe : sequences

Séquençage Sanger – Voir mes résultats Choisir la requête du 16 novembre 2012 – chromatogramme reverse

• À quelle position se retrouve le site de mutagénèse?• Pourquoi il peut y avoir une mauvaise qualité au début/fin?

Page 5: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Assemblage de vos séquences avec l’outil Cap3

Boîte à outils - Nettoyage/Assemblage

Mettre la reverse en 1er dans la boîte pour question de clarté par la suite et assemblez (sans nettoyer)! Le résultat sera nommé contig.

• Comment pourrions-nous vérifier rapidement si la mutation a belle et bien été introduite et ce sans autre mutation??

Page 6: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Alignement global VS local Global: aligne les séquences sur la totalité de

leur longueur Local: restreint l’alignement uniquement aux

régions de forte similarité Le reste des séquences est ignoré

Situation Local ou global?

2 protéines partagent un domaine homologue issu d’une fonction commune

Quand les séquences sont de tailles comparables

Local

Global

Page 7: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Alignement et utilités

Identifier des sites fonctionnels = régions les plus conservées

Prédire la fonction d'une protéine

Prédire la structure d'une protéine

Établir une phylogénie pour plusieurs protéines

Arbre phylogénétique - glycosylases

Région conservé en rose d’un domaine transmembranaire

Exemple de site fonctionnel?

Page 8: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Identifier si la mutation a été incorporée

Veuillez copier/coller la séquence Fasta du contig dans le fichier alignement.txt (disponible sous StudiUM) Ce fichier contient la séquence pUC 18 théorique brin moins (avec codon

stop)

Page 9: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Alignement avec ClustalX Alignement avec ClustalX (http://www.ebi.ac.uk/Tools/msa/clustalw2/)

afin de vérifier le niveau d’identité entre les deux séquences. Vous

allez constater qu’une * signifie un pairement parfait de 2 bases et un

représente un changement de base

Autre type de représentation

Page 10: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

ClustalX - Résultat

• Retrouvez-vous le site de mutagénèse??• Quel est la différence entre assembler et aligner?• Il s’agit d’un alignement global ou local que nous venons de réaliser?

Dans notre cas, l’alignement nous permettra de voir rapidement si d’autres mutations auraient pu s’incorporer proche du site de mutagénèse

Page 11: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Étude du gène de labêta-galactosidase chez l’humain

Structure de la beta-gal de E. coli.

Page 12: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Mise en situation… Vous êtes…

Chercheur généticien Spécialiste de l’enzyme bêta-galactosidase

Vous voulez… Étudier une maladie génétique liée à ce gène chez l’humain afin de découvrir

les variants génétiques susceptibles de prédisposer à cette maladie

Page 13: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Gène et symbole NCBI (National Center for Biotechnology Information, http://www.ncbi.nlm.nih.gov) Trouver le symbole du gène correspondant à la -galactosidase chez

l’humain GLB1

Trouver sa localisation cytogénétique 3p21.33

Gène à proximité ou à l’intérieur même du gène CCR4, SEC13, TMPPE, CRTAP

Page 14: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Maladie génétique mendélienne OMIM (Online Mendelian Inheritance in Man), un volet de NCBI C’est quoi ce type de maladie

Un gène = une maladie Facteur environnementaux = aucun impact

Transmission connue = autosomique dominante/récessive ou lié à l’X

Tandis qu’une maladie complexe…

Quelles maladies sont liées à ce gène?• GM1-Gangliosidosis• Pseudodeficiency Alleles• Mucopolysaccharidosis Type IVB (Morquio Syndrome B)

Page 15: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Population à l’étude

BALSAC: Base de données généalogiques

Fondé en 1972 par Gérard Bouchard Couvrant ~ 4 siècles d’histoire Hébergé à l’Université du Qc à Chicoutimi 3 millions d’actes de mariage et de naissance = 5

millions d’individus

L’établissement débuté au milieu des années 1800 Fondateurs provenant de la région de Charlevoix

Homogène génétiquement

Certaines maladies héréditaires montrent une prévalence inhabituellement élevée ou sont spécifiques à cet endroit

Un échantillon de 500 individusApril, 1993, Canadian satellite NOA 11April, 1993, Canadian satellite NOA 11

Saguenay-Lac-St-Jean!!!

• À quelle population vous pensez???

Page 16: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Comment pourrions-nous procéder à l’étude d’une maladie génétique dans une population?

Contrôle Cas

GLB1: …atgcgaggatgctgatcg… …atgcgaCgatgctgatcA…

Page 17: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Quel type de variant pouvons-nous étudier? CNV (copy number variant)

> 1000 bases

SNP (single nucleotide polymorphism)

Page 18: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Type de variants génétiques - CNV

Database of genomic variants de Toronto (http://projects.tcag.ca/variation/)

Quel est le pourcentage du Chr3 couvert par les CNVs? 76,3%

CNV en bleu

Page 19: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Type de variants génétiques - SNP

SNP (rs id)

Ensembl (http://useast.ensembl.org/index.html) Combien il y a de SNP dans le génome humain complet (incluant autres variations

courtes)? Cliquer Human et More information and statistics

Environ 64 millions Combien de variations sur le chromosome 3 (human chr3)?

4,598,132

Page 20: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Design de biopuces

Comment bien choisir les SNPs?

Page 21: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Conservation du gène parmi différentes espècesUCSC (http://genome.ucsc.edu/)

Page 22: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Ensembl (http://useast.ensembl.org/index.html) Sélectionner Human et inscrire GLB1 dans la boîte de recherche Dans le menu de gauche sélectionner Genetic Variation et Variation Table Vous obtenez alors un résumé des conséquences des variants

Cibler les SNPs susceptibles d'avoir une conséquence sur la transcription ( traduction protéine)

• J’attire votre attention sur le nombre phénoménal de SNPs dans 1 seul gène!!

Page 23: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Analyse d’association

RésultatsSNP Valeur P

rs13073546 0.3

rs199694629 0.00001

rs34421970 0.08

rs76016860 0.00000003

rs72555366 0.1

Allèle du SNP (rs13073546)

Cas Contrôle

C 200 20

T 50 230

Tests statistique (2) – sur 500 sujets

Page 24: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Conclusion

Nous avons identifier des variants génétiques liés à la maladie

Validation dans une autre population

Médecine personnalisée = traitement spécifique

Établir un profil génétique des personnes susceptibles de développer la maladie

Page 25: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Une carte génétique du Qc

L’UdeM est l'hôte de CARTaGENE (www.cartagene.qc.ca) Certains des chercheurs impliqués sont reliés au Département de biochimie!!!

Co-chercheur principal: Guy Rouleau Membres du groupe scientifique de travail pour conseiller ce projet:

Pierrette Gaudreau Daniel Sinnett Damien Labuda

20 000 adultes âgés entre 40 à 69 ans provenant de 4 régions métropolitaines de recensement du Québec et permettant d'étudier les facteurs génomiques de santé et de maladie dans une population vieillissante

Le Projet BALSAC collabore à l’option généalogique de CARTaGENE Créer une banque contenant des données sur la santé et une biobanque contenant du matériel

biologique Permettre l'accès à ces banques aux chercheurs dont les études satisfont aux exigences scientifiques

et éthiques pour la validation de leurs travaux et pour de nouvelles recherches au niveau populationnel Confirmer le leadership du Québec et du Canada dans les grandes études de génomique des

populations qui analysent les interactions entre gènes ainsi qu'entre gènes et environnement Développer les outils nécessaires au transfert des connaissances en génomiques dans le domaine de

la santé publique

Philippe Awadalla, Directeur scientifiqueProfesseur de pédiatrie à UdeM

Chercheur au CHU Sainte-Justine

Page 26: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Exercice à remettre

Remise INDIVIDUELLE en format NUMÉRIQUELa date limite se trouve sur la feuille du devoir ( 1 semaine+)Remise: esilbac

remise bcm3531 groupeB devoir.txt

Merci de votre présence!

Page 27: BCM3531: Bio-Informatique. Vos résultats de lIRIC Malheureusement lorganisation du temps des expériences cette année ne nous permet pas d'utiliser aujourd'hui

Références des images

http://www.msg.ucsf.edu/local/programs/Vega/plugins/clustalx.htm http://www.jle.com/en/revues/medecine/hma/e-docs/00/04/12/8A/article.phtml?fichier=images.htm http://fr.wikipedia.org/wiki/Thymine_DNA_glycosylase http://www.rcsb.org http://www.4896kj.com/journeying/category/funny/page/4/ http://www.ncbi.nlm.nih.gov/ http://en.wikipedia.org http://www.vbc-biotech.at/Affymetrix_Info.html www.ledevoir.com http://fr.wikipedia.org/wiki/Fichier:Domain_Homology.png http://fr.wikipedia.org/wiki/Alignement_de_s%C3%A9quences