20
29/01/2011 1 Un aperçu de la bioinformatique moléculaire A. Denise Bioinformatique LRI Orsay Université Paris-Sud 11 La cellule, unité du vivant

La cellule, unité du vivant - LRI

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: La cellule, unité du vivant - LRI

29/01/2011

1

Un aperçu de la bioinformatique moléculaire

A. Denise

Bioinformatique

LRI Orsay

Université Paris-Sud 11

La cellule, unité du vivant

Page 2: La cellule, unité du vivant - LRI

29/01/2011

2

Les trois règnes primaires

Bactéries

Archae

Eucaryotes

Procaryotes

Les organismes se reproduisent…

mais pas à l’identique

Page 3: La cellule, unité du vivant - LRI

29/01/2011

3

Les trois règnes primaires

Les organismes se reproduisent…

mais pas à l’identique

http://itol.embl.de/

Interactive Tree of Life

Page 4: La cellule, unité du vivant - LRI

29/01/2011

4

Le dogme centralADN

ARN

Protéines

Réplication

Transcription

Traduction

« Vue d’artiste »

© Ebbe Sloth

Andersen

Page 5: La cellule, unité du vivant - LRI

29/01/2011

5

La cellule contient un grand

nombre d’acteurs…Cellule hépatique du rat (volume 2 10-9 cm3)

Type de molécule

Nombre

ADN 42 (longueur totale : 2,75 109

nucl.)

ARN 1,5 108

Protéines 2,5 109

Petites molécules 1,4 1010(Callen 1999)

… et il y a beaucoup de cellules dans un organisme eucaryote

(de l’ordre de 1012 chez l’homme)

… qui interagissent

constamment

Kegg global metabolism map

http://www.genome.jp/kegg/

Page 6: La cellule, unité du vivant - LRI

29/01/2011

6

… qui interagissent

constamment

Kegg global metabolism map

L’ADN

Page 7: La cellule, unité du vivant - LRI

29/01/2011

7

L’ADN

Michel Termier IUT 2010 14

G C 5’T AA TC GC GC GA TT AC GA T 3’

L’ADN

Page 8: La cellule, unité du vivant - LRI

29/01/2011

8

Transcription de l’ADN en ARN

Transcription de l’ADN en ARN

Page 9: La cellule, unité du vivant - LRI

29/01/2011

9

Traduction de l’ARN en protéines

Michel Termier IUT 2010 18

T C A G

T

TTT Phe F

TTC "

TTA Leu L

TTG "

TCT Ser S

TCC "

TCA "

TCG "

TAT Tyr Y

TAC "

TAA *

TAG *

TGT Cys C

TGC "

TGA *

TGG Trp W

C

CTT Leu L

CTC "

CTA "

CTG "

CCT Pro P

CCC "

CCA "

CCG "

CAT His H

CAC "

CAA Gln Q

CAG "

CGT Arg R

CGC "

CGA "

CGG "

A

ATT Ile I

ATC "

ATA "

ATG Met M

ACT Thr T

ACC "

ACA "

ACG "

AAT Asn N

AAC "

AAA Lys K

AAG "

AGT Ser S

AGC "

AGA Arg R

AGG "

G

GTT Val V

GTC "

GTA "

GTG "

GCT Ala A

GCC "

GCA "

GCG "

GAT Asp D

GAC "

GAA Glu E

GAG "

GGT Gly G

GGC "

GGA "

GGG "

Code

génétique

MT

Page 10: La cellule, unité du vivant - LRI

29/01/2011

10

Le ribosome

Le ribosome

Page 11: La cellule, unité du vivant - LRI

29/01/2011

11

ARN de transfert

Réplication de l’ADN

Page 12: La cellule, unité du vivant - LRI

29/01/2011

12

Au début était la séquence (d’ADN).

5’ 3’

• Faire l’inventaire du contenu génétique.

• Elucider la fonction de chaque élément.

Promoteur ARNt

ARNt

ARNr

Introns

...

Au début était la séquence (d’ADN).

5’ 3’

Gène protéique

ARNm

Protéine

transcription

traduction

• Faire l’inventaire du contenu génétique.

• Elucider la fonction de chaque élément.

Page 13: La cellule, unité du vivant - LRI

29/01/2011

13

CACCACAATTGCAAAACTCCCAAGCCCGTCCACAAAAGAAGGACGGATTCTCACAGTTCATGCCATCTGCAACTACGAAGAACCCATATGCCCAGTAACT

CGACCGACTGGTTGTAATTTTACAAAAAGAGAGACAATTAAGAAAAGAAACAAGCGCCAGGCTTCCGTATCCCAGTTTTTCATCTCACTTTCTGGGCACG

ATTGTAATAATACTTCATGATAATAACTAAACTATATAAGTAGTGTCTCATCCGTAAATATACATTTAGACAGATTCTTGTATTTTCTCCGGGCAATTTT

TAACTTTTTTTCTGTTAGGGCACATGACACTTGCCTATTATGGACAGCCAGTAAAGATGTGCCCATATATTGCCCCCTTTACGCTCTCTGCCAGTATTAG

TGGGAAAAAAAAAACTGAAAAAAAAAAATCGCAGGACTACTAATAATCACGTGATATTTCTTTTCACTCTCTTCATAAAGTTGCTAAAAACACACAATCG

AATGAGCCTCTGAGCAGTATAAATTGTACTTCAAAGCACTATGCATGAAAAACGCTTACATTAGTTCAGTTTGTCAAGGTTATGCTATTACTTGTACTTA

TTTCTTGCTATTGTTAGTGGCTCCCCACATTGACGTATTTTCACGTGATGCGCCTCACTGCGGAAGGCGCCACACATTGCCTGCAAAAAATTGTGGATGC

ACTCATTTGATAGTAAACTAAGTCATGTTAATCGTTTGGATTTGGCACACACCCACAAATATACACATTACATATATATATATATTCAAAATACAGCTGC

GTCCAATAGATGAGCTTCCGCTTCGTTGTACAACCTACCTGCTATCTTGTTCACGGATATTTCTTGCTTTTAATAAACAAAAGTAACTCTAGAACAGTCA

AGTCTTCGATAATTTTTTTAGTCACAGGGTCCGTCTAAAGTTTCTCTTTATTTGGAATAATAGAAAAGAAAGAAAAAAACGTAGTATAAAAGGAATGTCG

CATACTTTAAAATCGAAAACGCTCCAAGAGCTGGACATTGAGGAGATTAAGGAAACTAACCCATTGCTCAAACTAGTTCAAGGGCAGAGGATTGTTCAAG

TTCCGGAACTAGTGCTTGAGTCTGGCGTGGTCATAAATAATTTCCCTATTGCTTATAAGACGTGGGGTACACTGAATGAAGCTGGTGATAATGTTCTGGT

AATTTGTCATGCCTTGACTGGGTCCGCAGATGTTGCTGACTGGTGGGGCCCTCTTCTGGGTAACGACTTAGCATTCGACCCATCAAGGTTTTTTATCATA

TGTTTAAACTCTATGGGCTCTCCATATGGGTCTTTTTCGCCATTAACGATAAATGAGGAGACGGGCGTTAGATATGGACCCGAATTCCCATTATGTACTG

TGCGCGATGACGTTAGAGCTCACAGAATTGTTCTGGATTCTCTGGGAGTAAAGTCAATAGCCTGTGTTATTGGTGGCTCTATGGGGGGGATGCTGAGTTT

GGAATGGGCTGCCATGTATGGTAAGGAATATGTGAAGAATATGGTTGCTCTGGCGACATCAGCAAGACATTCTGCCTGGTGCATATCGTGGTCTGAGGCT

CAAAGACAATCGATTTACTCAGATCCCAACTACTTGGACGGGTACTATCCGGTAGAGGAGCAACCTGTGGCCGGACTATCGGCTGCACGTATGTCTGCAT

TGTTGACGTACAGGACAAGAAACAGTTTCGAGAACAAATTCTCCAGAAGATCTCCTTCAATAGCACAACAACAAAAAGCTCAAAGGGAGGAGACACGCAA

ACCATCTACTGTCAGCGAACACTCCCTACAAATCCACAATGATGGGTATAAAACAAAAGCCAGCACTGCCATCGCTGGCATTTCTGGGCAAAAAGGTCAA

AGCGTGGTGTCCACCGCATCTTCTTCGGATTCATTGAATTCTTCAACATCGATGACTTCGGTAAGTTCTGTAACGGGTGAAGTGAAGGACATAAAGCCTG

CGCAGACGTATTTTTCTGCACAAAGTTACTTGAGGTACCAGGGCACAAAGTTCATCAATAGGTTCGACGCCAATTGTTACATTGCCATCACACGTAAACT

GGATACGCACGATTTGGCAAGAGACAGAGTAGATGACATCACTGAGGTCCTTTCTACCATCCAACAACCATCCCTGATCATCGGTATCCAATCTGATGGA

CTGTTCACATATTCAGAACAAGAATTTTTGGCTGAGCACATACCGAAGTCGCAATTAGAAAAAATTGAATCTCCCGAAGCCACGATGCCTTCCTATTGGA

GTTTAAGCTGATAAACAAACTGATAGTACAATTTTTAAAAACCAACTGCAAGGCCATTACCGATGCCGCTCCAAGAGCTTGGGGAGGCGACGTTGGTAAC

GATGAAACGAAGACGTCTGTCTTTGGTGAGGCCGAAGAAGTTACCAACTGGTAGGGATAGATACCACACATACCTCAGGCATAACATAGATAAACCAGTA

CATGTATATCTATATCTATATTTATATATAGACAAACAGCATTAATTAACTATAACAAAGTTTCTAGTAACACTAACGGTAGTTAATTTCTCTTTTTTGT

CCTCGTTGTTGAAAAACGAAAGAAGAATGAAAAAAAAAAAAACAAAAGAGTAATAGCTAGTGTTTTAGAGCTTTTCCACATTCTGACCGCACTTGTAGAC

AGCCACTCTTTGCATTGCCACTCGACATTACATGAACGACTGTTCTTCTCCCTGTCGCCTTAGCTTACTTCTTTGAAAAAAGCAAATCGCCCTTTTATGT

AGGGACAAGTAACTTTTAGATC...

Beaucoup de longues séquences !

Page 14: La cellule, unité du vivant - LRI

29/01/2011

14

Séquences

Connaissances biologiques

ORF = ATG [(A+C+G+T)3]* (TAA+TAC+TAG)

Algorithmique

Statistiques

Evolution

Inventaire

L’évolution nous aide !

Zones conservées

Page 15: La cellule, unité du vivant - LRI

29/01/2011

15

Mais la séquence n’est pas tout !

• Par quels mécanismes l’information génétique

s’exprime-t-elle ?

• Comment se structure-t-elle ?

• Comment participe-t-elle à la dynamique de la

cellule ?

Structure des protéines

Page 16: La cellule, unité du vivant - LRI

29/01/2011

16

Structure de l’ARN

Dynamique de l’expression : facteurs de transcription

Page 17: La cellule, unité du vivant - LRI

29/01/2011

17

Régulation

Réseaux de régulation

Page 18: La cellule, unité du vivant - LRI

29/01/2011

18

« Vue d’artiste »

© Ebbe Sloth

Andersen

Séquence Fonction

Structure Régulation

Page 19: La cellule, unité du vivant - LRI

29/01/2011

19

Une tentative de définition de la

Bioinformatique

Alliance de la Biologie avec l’Informatique, les Mathématiques, la Physique,

la Chimie… afin de modéliser les processus du vivant, pour

• les comprendre,

• les prédire,

• les simuler,

• les reproduire ou les modifier.

Une démarche de recherche fondamentale, dont les résultats ont des

retombées potentielles dans le biomédical, dans les biotechnologies.

Structure EvolutionTranscriptomeGénome

Protéome / Interactome

Données « haut débit »

Expérimentation

Une tentative de définition de la

Bioinformatique

Page 20: La cellule, unité du vivant - LRI

29/01/2011

20

• Algorithmique et combinatoire. Programmation logique et réseaux de

contraintes. Optimisation. Model-checking.

• Inférence, apprentissage, classification, fouille de textes et extraction de

connaissances.

• Intégration de données massives et hétérogènes.

• Analyse d’images.

• Visualisation, IHM.

• Calcul intensif, calcul distribué.

• …

Nous (informaticiens) avons du

travail en

Formations en Bioinformatique à Orsay

• Option Bioinformatique en IUT Informatique 2ème

année.

• Options en L3 Informatique (et aussi en L3 Math. et

L3 Biologie)

• Master de Bioinformatique et Biostatistiques (BIBS).

http://www.bibs.u-psud.fr. Accessible avec une licence

d’informatique, de mathématiques ou de biologie.