Les nouvelles preuves de l’évolution: y accéder en classe PO 422

Preview:

DESCRIPTION

Les nouvelles preuves de l’évolution: y accéder en classe PO 422. Phylogénie. Etude des relations de parenté entre espèces. - PowerPoint PPT Presentation

Citation preview

Novembre 2009Phylogénétique 1

Les nouvelles preuves de l’évolution: y accéder en

classePO 422

Novembre 2009Phylogénétique 2

Phylogénie

Etude des relations de parenté entre espèces.

Une analyse phylogénétique permet d’estimer (modéliser) les relations évolutives qui existent entre les espèces grâce à un arbre: qui a un ancêtre commun - qui est le cousin de qui ?

Novembre 2009Phylogénétique 3

http://www.unige.ch/450/expositions/genome/presentation/slogans.html

Novembre 2009Phylogénétique 4

Il est possible de construire un arbre phylogénétique à partir de différents types de données:

– Les données morphologiques (écailles ou plumes, présence de certains os du crâne, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes.

– Les caractères physiologiques (température corporelle…)– L’ordre des gènes (par exemple sur l’ADN des mitochondries)– Les données moléculaires (séquences d’ADN ou de protéines).

Des mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution.

– toutes les données existantes….(défi scientifique !)

Novembre 2009Phylogénétique 5

Novembre 2009Phylogénétique 6

Il est possible de construire un arbre phylogénétique à partir de différents types de données:

– les données morphologiques (écailles ou plumes, présence de certains os du crâne,, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes.

– Les caractères physiologiques (température corporelle…)– L’ordre des gènes (par exemple sur l’ADN des mitochondries)– les données moléculaires (séquences d’ADN ou de protéines).

Des mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution.

– toutes les données existantes….(défi scientifique !)

Novembre 2009Phylogénétique 7

http://tecfa.unige.ch/perso/lombardf/calvin/images/restricted/index.php?op=5&path=evolution&file=cytochrome-divers-org.jpg

Novembre 2009Phylogénétique 8http://www.sciencedaily.com/releases/2009/11/091104132706.htm

Novembre 2009Phylogénétique 9

http://www.unige.ch/450/expositions/genome/presentation/slogans.html

Novembre 2009Phylogénétique 10

• Les mutations dans l’ADN peuvent être dûes à– Des erreurs lors de la réplication de l’ADN– Des agents chimiques ou physiques (fumée de cigarette, UV,…)– Des virus

• Les conséquences des mutations peuvent être des changements ‘mineurs’ (changement d’un acide aminé pour un autre) ou majeurs (duplication de gènes, délétion d’un bout de chromosomes, …)

• Chez les mammifères, à chaque génération, il se produit en moyenne quelques dizaines de mutations dans le génome de chaque individu.

– Si ces mutations se trouvent dans l’ADN des cellules sexuelles, elles seront transmises à la descendance.

– La sélection naturelle favorisera la sélection des individus avec des mutations qui augmentent les chances de reproduction et de survie dans un environnement donné.

Novembre 2009Phylogénétique 11

Il est possible de ‘lire’ l’évolution dans les gènes (séquences en acide

nucléique) ou les protéines correspondantes (séquences en acide

aminé).

Les données moléculaires peuvent être utilisées pour établir des relations de parenté phylogénétique entre les organismes, et donc pour reconstruire l’arbre de la

vie.

Ces données sont libres d’accès sur internet…

Novembre 2009Phylogénétique 13

www.uniprot.org (query ‘insulin’)

Novembre 2009Phylogénétique 14

www.uniprot.org (query ‘insulin’)

Novembre 2009Phylogénétique 15

Alignement multiple des séquences en acides aminés de l’insuline de différentes espèces

www.uniprot.org (query ‘insulin’, align)

Novembre 2009Phylogénétique 16

Hélice alpha

Hélice alpha

Peptide signal

On ne peut pas ‘muter’ n’importe quoi….

Novembre 2009Phylogénétique 17

Cladogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline- Qui est le cousin de qui ? Qui a un ancêtre commun ?

www.phylogeny.fr

Le résultat peut dépendre de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’…

Novembre 2009Phylogénétique 18

Un ancêtre commun

Novembre 2009Phylogénétique 19

La construction d’arbre phylogénétique ne serait pas

possible …

sans la notion d’ancêtre commun…

Les espèces ne sont pas immuables, mais issues d’autres espèces et peuvent elles-mêmes

donner naissance à de nouvelles. La sélection naturelle est opportuniste et ne poursuit aucun

but à long terme.

Jean-Baptiste de Lamarck et Charles Darwin

Novembre 2009Phylogénétique 20

• Cette notion d’ancêtre commun a été confirmée – par la découverte de l’ADN et du code

génétique ‘quasi universel’* que se partagent tous les organismes vivants.

*http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c

– par la découverte de gènes très conservés entre les espèces (exemples: gène ‘engrailed’, histone H4, ARN ribosomal) et de gènes ‘universels’ (~200).

http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Novembre 2009Phylogénétique 21

Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Novembre 2009Phylogénétique 22

LUCA: Last Universal Common Ancestor

LUCA est la ‘racine’ de l’arbre de la vie, mais probablement pas le premier organisme unicellulaire vivant. Il devait être déjà complexe et donc le résultat d’un long processus d’évolution

Novembre 2009Phylogénétique 23

Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Novembre 2009Phylogénétique 24

http://www.peabody.yale.edu/exhibits/treeoflife/challenge.html

Novembre 2009Phylogénétique 25

Comment construire des arbres phylogénétiques sur la

base des séquences des protéines…

Novembre 2009Phylogénétique 26

Le principe

• 1. Sélection: set de séquences de protéines ‘homologues’

• 2. Comparaison: alignement multiple

• 3. Construction de l’arbre: ‘calculer les différences’

Novembre 2009Phylogénétique 27

Le principe

• Sélection: set de séquences de protéines ‘homologues’

• Comparaison: alignement multiple• Construction de l’arbre: ‘calculer

les différences’

Novembre 2009Phylogénétique 28

Trouver des séquences de protéines homologues…

• ‘query’ par nom de protéines ou nom de gènesUtiliser http://www.uniprot.org/Exemples:

http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Blast Utiliser h

ttp://www.expasy.org/tools/blast/ou le Blast@UniProt

Novembre 2009Phylogénétique 29

Protein and gene nameS

www.uniprot.org/ query FOLH1

Novembre 2009Phylogénétique 30

www.uniprot.org

Novembre 2009Phylogénétique 31

Limiter votre requête selon les propositions de l’outil de

recherche. Dans notre cas: ‘insulin est un ‘protein name’

Novembre 2009Phylogénétique 32

Novembre 2009Phylogénétique 33

Customize display

Novembre 2009Phylogénétique 34

www.uniprot.org (query ‘name:insulin’)

Novembre 2009Phylogénétique 35

2- Cliquer sur ‘Retrieve’ pour récupérer les séquences en

format ‘Fasta’

1- Sélectionner les protéines homologues qui vous

intéressent

Novembre 2009Phylogénétique 36

Cliquer sur ‘Open’ pour récupérer les séquences en

format ‘Fasta’

Novembre 2009Phylogénétique 37

Novembre 2009Phylogénétique 38

Si vous souhaitez faire un alignement multiple:

…utile comme moyen de vérifier la pertinence des séquences que vous avez sélectionnées…

Novembre 2009Phylogénétique 39

Sélectionner les séquences homologues provenant d’espèces différentes

!!! Les séquences doivent être homologues (même protéine

chez différentes espèces)

Novembre 2009Phylogénétique 40

Cliquer sur ‘Align’ pour faire une comparaison des

séquences sélectionnées (alignement multiple)

Novembre 2009Phylogénétique 41

1- Éditer manuellement le texte: remplacer les

numéros d’accession par le nom de l’espèce

2- cliquer ici

Novembre 2009Phylogénétique 42

Novembre 2009Phylogénétique 43

Le principe

• Sélection: set de séquences de protéines ‘homologues’

• Comparaison: alignement multiple• Construction de l’arbre: ‘calculer

les différences’

Novembre 2009Phylogénétique 44

www.phylogeny.fr

• Introduire le set de séquences sélectionnées à www.uniprot.org (format ‘fasta’)

• Utiliser les paramètres par défaut (‘one’ click)

Novembre 2009Phylogénétique 45

www.phylogeny.fr

Novembre 2009Phylogénétique 46

Copier –coller les séquences en format ‘Fasta’ récupérées sur

le site UniProt

Novembre 2009Phylogénétique 47

Modifier le texte (nom des espèces) si vous le souhaitez…

Novembre 2009Phylogénétique 48

Cliquer sur ‘submit’

Novembre 2009Phylogénétique 49

Cladrogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline- Qui est le cousin de qui ? Qui a un ancêtre commun ?

www.phylogeny.fr

Novembre 2009Phylogénétique 50

Les différents types d’arbres (1)

Novembre 2009Phylogénétique 51

• Un arbre phylogénétique est un modèle qui décrit les relations entre des unités taxonomiques, basé sur des caractères homologues.

Novembre 2009Phylogénétique 52

Arbres (cladogrammes)

BA

Roots

Internal nodes

C D E F G BA C D E F GEnd nodes

Branches

Novembre 2009Phylogénétique 53

Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Combien d’arbres différents ?

Novembre 2009Phylogénétique 55

Les différents types d’arbres (2)

Arbres phylogénétiques

• Cladogramme

• PhylogrammeLa longueur des branches est proportionnelle aux différences. Cette longueur n’est pas toujours facile à interpréter ! Elle dépend entre autre de la vitesse d’évolution…(nombres de variations par site dans un laps de temps donné)

Qui est le cousin de qui ?

Novembre 2009Phylogénétique 57

Exemple de cladogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline- Qui est le cousin de qui ? Qui a un ancêtre commun ?

www.phylogeny.fr

Novembre 2009Phylogénétique 58

• Refaire le phylogramme en incluant le nombre de variations par site !!!!!

Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline- Quelle protéine a évolué plus rapidement ?

Le temps qui s’écoule….

Echelle: ‘expected number of changes

per site’

Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline- Quelle protéine a ‘évolué’ plus rapidement ?

Probabilité que l’arbre ait la bonne configuration à chaque embranchement

(> 0.95: OK)

Echelle: ‘expected number of changes

per site’

Le temps qui s’écoule….

L’insuline de la carpe a ‘évolué’ (moins de

changements dans sa séquences en acides

aminés) moins rapidement que

l’insuline des autres espèces…

Novembre 2009Phylogénétique 61

Les gènes (et les protéines) évoluent à des vitesses différentes

L’histone H4 n’a accumulé que 2 mutations ‘conservatives’ en 1.5 milliard d’années

Une protéine qui a évolué extrêmement rapidement: l’involucrin (une protéine de la peau): 10 % de changements en l’espace de 4 millions d’années (séparation des chimpanzés et de l’homme)

Les gènes (et les protéines) évoluent à des vitesses différentes

Novembre 2009Phylogénétique 63

Les embranchements

• Spéciation• Duplication de gènes

Novembre 2009Phylogénétique 64

Human gene A

Mouse gene B

Mouse gene A

Human gene B

Frog gene A

Frog gene B

Drosophila gene AB

Orthologs

Orthologs

Paralogs

Homologs

Gene duplication

Ancestral gene

Spéciation et duplication de gène

speciation

speciation

speciation

speciation

Novembre 2009Phylogénétique 65

Spéciation et duplication de gène

Duplication ins1 – ins 2

Spéciation rat - souris

Novembre 2009Phylogénétique 66

Perspectives et applications

Novembre 2009Phylogénétique 67

Les mitochondries et chloroplastes sont d’origine bactérienne ‘endosymbiotique’

http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Facteur d’élongation

Novembre 2009Phylogénétique 68

Autres projets

- ~200 protéines universelles - Arbre ‘global’

Applications- métagénomes (identifications de nouvelles espèces, de nouveaux gènes (20 mo), de nouveaux enzymes….)-1ml d’eau de mer: 1 million de bactéries et 10 million de virus (C.Venter).- découvertes de nouvelles bactéries (la moitié de la biomasse)

- médecine: identification de nouveaux pathogènes.

Novembre 2009Phylogénétique 69

Ressources taxonomiques

Novembre 2009Phylogénétique 70

http://www.ncbi.nlm.nih.gov/guide/taxonomy/

Novembre 2009Phylogénétique 71http://www.uniprot.org/taxonomy/

Novembre 2009Phylogénétique 72

Références

• http://www.unige.ch/presse/Campus/campus95.html

Novembre 2009Phylogénétique 73

Liste de gènes intéressants

‘Conceptual bases for quantifying the role of the environment on gene evolution: the participation of positive selection and neutral evolution’

http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART

Novembre 2009Phylogénétique 74

Exemple de gènes / protéines

• http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Novembre 2009Phylogénétique 75

Divers

- Simulation par ordinateur: avec 2 mécanismes, le hasard et la sélection, l’informaticien Karl Sim a généré une complexité fascinante: http://www.archive.org/details/sims_evolved_virtual_creatures_1994

Novembre 2009Phylogénétique 76

A vous de jouer…

Novembre 2009Phylogénétique 77

Phylogenetic servers

• http://www.phylogeny.fr/ • http://bioweb.pasteur.fr/seqanal/phylogeny/intro-uk.htm

l• http://atgc.lirmm.fr/phyml/• http://phylobench.vital-it.ch/raxml-bb/• http://power.nhri.org.tw/power/home.htm

Novembre 2009Phylogénétique 78