Jeux sous forme extensive. Objectif u Modéliser des interactions où la structure temporelle et...

Preview:

Citation preview

Jeux sous forme extensive

Objectif

Modéliser des interactions où la structure temporelle et l’information dont disposent les joueurs paraissent importants.

Structure temporelle: caractère séquentiel des décisions

Information: Ce que le joueur sait lorsqu’il doit décider

Illustration

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Le caractère séquentiel des décisions est-il important ?

Pas autant qu’on pourrait le croire On peut représenter l’interaction sous-

jacente à cet exemple dans un jeu sous forme normale

On doit pour se faire réinterpréter quelque peu la notion de stratégie

Une stratégie devient un plan d’actions contingents à l’atteinte d’un nœud de décision (ex: la stratégie « guerre » de FT n’a de prise sur le réel que si DT décide d’entrer)

Menace à l’entrée sous forme normale

Entre

n’entrepas

guerre paix

FT

DT

(-25,75) (50, 150)

(0,300) (0,300)

Un autre exemple séquentiel (Kreps)

Deux fabricants de jouets A et B envisagent de lancer un jeu différent avant noël.

Si A lance son jeu, il doit dépenser (coûts fixes) 40 000 euros en conception, commercialisation, et production. Le coût correspondant pour B est de 60 000 euros.

Le marché du jouet est incertain. Avec probabilité 2/5, il sera bon (ventes totales de 20 000 unités). Avec probabilité 3/5, il sera mauvais (ventes de 6000 unités).

Un autre exemple séquentiel (Kreps)

Si les 2 firmes lancent le jouet, le prix d’équilibre est de 10 euros. Si une seule des deux firmes lance le jeu, le prix d’équilibre est de 12 euros

Coût marginal de 5 euros pour firme A et 3 euros pour firme B (en + des coûts fixes)

La firme B a un avantage: Elle a fait une étude de marché qui lui permet de connaître avant de lancer son jeu l’état du marché (bon ou mauvais).

Forme extensive

inout

good

bad

0,4

0,6

naturenature

good0,4

bad0,6

A

B B

B B

in

out

in

out

in

out

in

out

(0,120)

(0,0)

(0,-6)

(0,0)

(10,10)

(100,0)

(-25,-39)

(2,0)

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

=0,4x10+0,6x(-25)

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in

out

in,in in, out out,in out,outB

A

Un autre exemple: Information imparfaite

Sylvester aime se battre contre des mauviettes, mais ne sais pas distinguer une mauviette d’un homme viril avant d’engager le combat(en moyenne 2/3 des hommes sont mes mauviettes, 1/3 sont virils)

Sylvester est devant un café et envisage de taper sur la première personne qu’il pense être une mauviette.

Tartarin est dans le café et sait qu’il va passer sur le chemin de Sylvester; Tartarin n’aime pas se battre (qu’il soit ou non une mauviette)

Sylvester peut observer la consommation de Tartarin

Il sait que les mauviettes préfèrent le lait grenadine alors que les hommes virils préfèrent la bière

Forme extensive

faible (2/3)

fort (1/3)

bière

lait

TartarinTartarin

bière

laitNature

Sylvester

Sylvester

combat

paix

combat

paix

combat

paix

combat

paix

(1,-1)

(3,0)

(0,-1)

(2,0)

(-1,1)

(2,0)

(0,1)

(3,0)

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C 2/3 C,P P,C 1/3 P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière1/2

lait, bière

C,C 2/3 C,P P,C 1/3 P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait1/2

lait, lait

Jeux sous forme extensive

G = (N, T, , i (.), A(.), α(.), I, U(.), ) N = {1,…,n} ensemble des joueurs (le nème

joueur étant interprété comme étant « la nature » (n > 2))

T = ensemble des nœuds de décision (supposé fini)

est une relation d’arborescence reliant les nœuds entre eux en terme de « postériorité » : t t’ signifie que le nœud t vient après le nœud t’

Propriétés de la relation d’arborescence

La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t

Propriétés de la relation d’arborescence

La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t

Ceci n’est pas autorisé:

t’

t

t’’

Propriétés de la relation d’arborescence

La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t

Ceci non plus:

t’

t

t’’

Propriétés de la relation d’arborescence

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors: #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

Propriétés de la relation d’arborescence

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »

Propriétés de la relation d’arborescence

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »

Cette proposition nous permet de « remonter le long de l’arbre des branches à la racine »

Propriétés de la relation d’arborescence

W T : L’ensemble des nœuds initiaux (sans prédécesseurs)

Z T : L’ensemble des nœuds finaux (sans successeurs)

X = T\Z L’ensemble des nœuds qui ne sont pas finaux

s(t) = {t’T:t’ t et t t’’ t’’ tel que t’ t’’} (successeurs immédiats de t)

p(t) = {t’T:t t’ et t’’ t t’’ tel que t’’ t’} (prédécesseurs immédiats de t) (singleton)

Jeux sous forme extensive i: X N, une fonction qui associe à chaque

nœud non terminal l’identité du joueur (qui peut être la nature) qui doit jouer à ce nœud

A: X C, une correspondance qui associe à chaque nœud non terminal un ensemble d’actions pouvant être adoptées à ce nœud

Pour tout t X, α: s(t) A(t) (fonction biunivoque, qui associe à chaque successeur immédiat de t l’unique action qui y mène uniquement)

Jeux sous forme extensive

I: Une partition de T en ensembles d’information

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes:

Jeux sous forme extensive

I: Une partition de T en ensemble d’information

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)

Jeux sous forme extensive

I: Une partition de T en ensembles d’information.

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)

(b) A(t) = A(t’)

Jeux sous forme extensive

U: N\{n}Z fonction de paiement qui associe à chaque joueur (la nature mise à part) et à chaque nœud terminal un paiement numérique

: une fonction qui associe à chaque nœud initial et à chaque nœud où la nature est amenée à jouer une probabilité.

Forme extensive et temporalité

Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »

Forme extensive et temporalité

Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »

2

3

1

1/2

1/2 S

GG

S

S’’

G’’

S’’

G’’

G’

S’

G’

S’

Forme extensive et mémoire

Le formalisme des formes extensives est a priori compatible avec de l’oubli de la part des joueurs

Voici différents types d’oubli

Oubli immédiat d’action passée

Oubli non-immédiat d’action passée

g d

1

2G D G D

1

Oubli non-immédiat d’action passée

g d

1

2G D G D

1

Le joueur 1 a oublié qu’il a joué g!!

Oubli d’information passée

b b

1

2G D G D

1

1d g

Oubli d’information passée

b b

1

2G D G D

1

1d g

1 a oublié ce qu’il savait avant!!!

Hypothèse de mémoire parfaite

On exclut les trois types d’oublis précédents.

Equilibre-parfait en sous-jeu

Le concept clé d’équilibre pour les jeux sous forme extensive est le concept d’équilibre parfait en sous-jeu (subgame perfect equilibrium)

Ce concept est du à Reinhart Selten (prix Nobel)

s’applique surtout à des jeux à information complète

Notion clé: sous jeu

Sous-jeu (définition)

Un sous-jeu d’une forme extensive est un nœud t et tous ses successeurs S(t) qui satisfont la propriété que h(t) = {t} et, pour tout t’ dans S(t), h(t’) S(t)

Sous-jeux (exemple 1)

Sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Sous-jeux (exemple 1)

FTguerre

paix(50,150)

(-25,75)

Sous-jeux (exemple 1)

FTguerre

paix(50,150)

(-25,75)

sous-jeu 1

Sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

sous-jeu 1

Sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

sous-jeu 1

sous-jeu 2

Sous-jeux (exemple 2)

Un pirate de l’air rationnel veut détourner un avion à destination de Marseille sur Tripoli en menaçant de le faire exploser

La menace n’est pas crédible au sens où le pirate n’a pas intérêt à mettre sa menace à exécution

Sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,-1)

Sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,1)

sous-jeu 1

Sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,-1)

sous-jeu 1

sous jeu 2

Attention pas de sous jeu ici:

Attention: pas de sous-jeu ici:

faible (2/3)

fort (1/3)

bière

lait

TartarinTartarin

bière

laitNature

Sylvester

Sylvester

combat

paix

combat

paix

combat

paix

combat

paix

(1,-1)

(3,0)

(0,-1)

(2,0)

(-1,1)

(2,0)

(0,1)

(3,0)

Equilibre-parfait en sous-jeux

Une combinaison de stratégies behaviorales est un équilibre (de Nash) parfait en sous-jeu si les stratégies sont des équilibres de Nash dans tous les sous-jeux du jeu

Equilibre parfait en sous-jeux (exemple 1)

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

(1) n’entre pas, guerre

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

(1) n’entre pas, guerre (2) entre, paix

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

(1) n’entre pas, guerre (2) entre, paix

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

(2) entre, paix

Equilibre parfait en sous-jeux (exemple 1)

entre

n’entre pas

DT

FTguerre

paix

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

(2) entre, paixSeul celui-ci est parfait en sous jeu

Equilibre parfait en sous-jeux (exemple 2)

Equilibre parfait en sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,-1)

Equilibre parfait en sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,-1)

Nash 1: le pilote va à Tripoli, le pirate fait exploser l’avion à Marseille

mais pas à Tripoli

Equilibre parfait en sous-jeux (exemple 2)

Marseille

Tripoli

pilote

pirate rien

explose

(0,1)

(-1,-1)

(1,0)

rien

explose

pirate

(-1,-1)

Nash 2: le pilote va à Marseille, le pirate ne fait jamais exploser l’avion

Remarque sur la perfection en sous-jeu

Ce concept de solution coincide avec l’élimination itérative des stratégies faiblement dominées lorsque le jeu en forme extensive est représenté en forme normale

Nous l’avons vu avec FT et DT Regardons le avec l’exemple du

pirate de l’air

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Autres solutions pour des jeux sous forme extensive

La notion de perfection en sous-jeu s’applique principalement à des situations de jeux à information parfaite (ensembles d’information sont des singletons)

Considérons les jeux suivants

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Un équilibre de Nash: D, a, L

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Un équilibre de Nash: D, a, L

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Un équilibre de Nash: D, a, L

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Un équilibre de Nash: D, a, L

Un autre: A,a,R

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Un équilibre de Nash: D, a, L

Un autre: A,a,R

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Examinons D, a, L

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Examinons D, a, L

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Cet équilibre n’est pas très plausible car il exige de 2 le choix, à un nœud non-atteint, de a qui ne serait

pas rationnel étant donné le choix de L par 3

Exemple 1

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

On voudrait un critère qui élimine cet équilibre. La notion de perfection en sous-jeu ne peut être utilisée ici

car ce jeu n’a pas de sous-jeu strict

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

A,l est un équilibre de Nash

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

A,l est un équilibre de Nash

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

étant donné le choix de l par 2, 1 préfère jouer A et étantdonné que 1 joue A, les préférences de 2

sur son choix d’action n’ont aucune importance

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Comme dans l’exemple précédent, on ne trouve pas très plausible cet équilibre: 2, s’il devait jouer, devrait choisir r et ce, où qu’il soit dans son ensemble d’information !!

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r

Exemple 2

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r

Intuition derrière ces exemples

Même idée que pour la perfection en sous-jeu: on se méfie des équilibres qui impliquent des comportements irrationels à des ensembles d’information qui ne sont pas atteints

Difficulté technique: ces ensembles d’information ne sont pas des singletons

Il faut donc formaliser de manière soigneuse les croyances (probabilistes) que peut avoir le joueur d’être aux différents nœuds d’un ensemble d’information

Equilibre séquentiel (Kreps & Wilson (1982)) Vise à traiter de tels exemples Un équilibre séquentiel est constitué, pour

chaque joueur i, de deux ingrédients: 1. un profil de stratégies (mixtes) i qui

prescrit, à toute action a de A(t) où i(t) = i, la probabilité it(a) qu’a l’action a d’être choisie.

2. un système de croyances probabilistes i qui associe, à chaque ensemble d’information h I où i joue, une fonction de probabilité sur les nœuds de h. i(h;t): probabilité qu’attribue i d’être au nœud t, étant donné qu’il est dans l’ensemble d’information h.

Croyances probabilistes ?

Croyances probabilistes ?

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Croyances probabilistes ?

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Elles sont triviales pour les joueurs 1 et 2, mais elles doivent être définies pour le joueur 3

Croyances probabilistes ?

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

S’il est amené à jouer, quelle probabilité devrait attribuer 3 au fait d’être à droite ou à gauche ?

Equilibre séquentiel: définition informelle

Un équilibre séquentiel est une combinaison de stratégies mixtes et de croyances telle que, à chaque ensemble d’information h du jeu, le joueur qui décide à cet ensemble le fait optimalement étant donné ce qui a été fait jusque là (compte tenu de ses croyances , et étant donné ce qui sera fait jusqu’à la fin du jeu, tel que spécifié par )

Equilibre séquentiel (illustration 1)

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

(D, a, L) n’est pas un équilibre séquentiel

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

En effet, puisque 3 jouera L, 2 ne devrait pas jouer a s’il était amené à jouer, étant données ses croyances (triviales) d’être à l’unique nœud constitutif de son

ensemble d’information

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

En revanche, A, a, R est un équilibre séquentiel

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

En revanche, A, a, R est un équilibre séquentiel

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Si 1 pense que 2 jouera a et que 3 jouera R, il doit choisir A, étant données ses croyances (triviales)

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Si 2 anticipe que 3 choisira R, il a raison choisir a plutôt que d, étant données ses croyances (triviales) d’être à

l’unique nœud de son ensemble d’information

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

Finalement le choix de R par 3 est rationnel pour ce joueur s’il attribue une probabilité 3 au moins aussi

grande que 3/5 au fait d’être au nœud de droite de son ensemble d’information

Equilibre séquentiel (illustration 1)

1

D

A 2 a(3,3,0)

3

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

d

En effet, si 3 3/5, 32 + (1- 3) (1- 3)4

Paiement espéréavec R

Paiement espéréavec L

Equilibre séquentiel (illustration 2)

Equilibre séquentiel (illustration 2)

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Equilibre séquentiel (illustration 2)

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

L’équilibre de Nash (A,l) n’est pas séquentiel

Equilibre séquentiel (illustration 2)

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

A est une meilleure réponse à une anticipationde l mais, quelles que soient les croyances que 2 peut

avoir sur le fait d’être à droite ou à gauche de son ensemble d’information, il n’est pas rationnel pour lui de jouer l

Equilibre séquentiel (illustration 2)

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

En revanche, (L, r) est un équilibre séquentiel car si 2 joue r, 1 a intérêt à jouer L et si 1 joue L, 2 a intérêt à jouer r lorsqu’il assigne une probabilité de 1 au fait d’être au nœud de gauche

de son ensemble d’information.

Equilibre séquentiel (illustration 2)

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Cet exemple suggère que des restrictions doivent être imposées aux croyances . Les seules croyances que 2 peut

avoir est qu’il est au nœud de gauche avec probabilité 1

Restrictions sur les croyances probabilistes ?

Restrictions sur les croyances probabilistes ?

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

Restrictions sur les croyances probabilistes ?

2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L R

A

L’ensemble d’information de 2 est atteint avec probabilité nulle à la combinaison de stratégies A,l

Limites de l’équilibre séquentiel

Il restreint très peu les croyances que les joueurs peuvent avoir

Considérons les deux exemples suivants

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

(A,r) est un équilibre séquentiel

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

(A,r) est un équilibre séquentiel

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

1 a intérêt à jouer A si elle croit que 2 jouera r.

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

1 a intérêt à jouer A si elle croit que 2 jouera r. Or 2, s’il croit être au nœud de droite de son ensemble

d’information avec une proba supérieure à ¼, a effectivement intérêt à choisir r

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

La croyance probabiliste de 2, si elle n’est pas exclue parla notion de cohérence sous-jacente à l’équilibre

séquentiel, n’est quand même pas « raisonnable » 

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

Si 2 se fait donner l’occasion de jouer, il devrait comprendre que cet état de fait résulte d’une

décision du joueur 1 de renoncer à un paiement de 2

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait

donc attribuer une probabilité de 1 au nœud de gauche

Un équilibre séquentiel pas intuitif

2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

L R

A

A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait

donc attribuer une probabilité de 1 au nœud de gauche

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

Nash (séquentiel)

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

Nash (séquentiel)

Nash (séquentiel)

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

Strictly dominated

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

Weak domination

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

A

B

C

l r

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

un équilibre de Nash

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

1 annonce pile indépendamment du résultat du jetet 2 annonce face si 1 annonce pile et pile si 1 annonce face

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

1 annonce « pile » indépendamment du résultat du jetet 2 annonce « face » si 1 annonce « pile » et « pile » si 1 annonce « face »

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Cette combinaison de stratégies est évidemment un équilibre de Nash (si 1 croit que 2 va dire le contraire de ce qu’elle annonce, elle

a intérêt à dire « pile » indépendamment du jet de la pièce)

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)Si 1 dit « pile » indépendamment du résultat du jet, 2 a intérêt à dire « face » s’il

entend pile car son paiement moyen est plus grand que celui qu’il obtiendrait en disant « pile ». Ce qu’il prévoit de faire s’il entend « face » est sans importance car

cette éventualité ne se produit pas

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Evidemment, il faut se demander si le comportement de 2 à l’ensemble d’information non atteint peut être rationalisé par

certaines croyances probabilistes.

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

C’est le cas! Déclarer « pile » après avoir entendu « face » est rationnel pour 2 si celui-ci croit qu’il y a au moins 1

chance sur 2 que la pièce soit tombée sur « pile »

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Question: une telle croyance probabiliste est-elle rationnelle ?

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Réponse: Non! 1 a tout intérêt à dire « face » s’il voit « face » et « pile » s’il voit « pile » (il reçoit un bonus pour dire la vérité)

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Donc, si 2 entend 1 lui dire « face », il doit conclure qu’il y a au moins 8 chances sur 10 que la pièce soit tombée sur « face »,

dans lequel cas, il devrait plutôt répondre « face »

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Autre équilibre séquentiel: 1 annonce « face » indépendamment du résultat du jet et 2 dit la vérité

On voit, ici aussi, cela avec la forme normale

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

dominé par une mixture de FF et PP (proba 3/7 à FF)

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

dominée par FF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

dominée par FF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

Dominée par FP

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

On voit, ici aussi, cela avec la forme normale

FF

FF PP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

FP

PF

PP

FP PF

Formalisons le critère dit « intuitif » de Cho et Kreps (1987)

S’applique à des jeux à 2 joueurs appelés « jeux de signaux »

La nature joue en premier et sélectionne un nœud t dans un ensemble avec une distribution de probabilité

Le joueur 1 est informé de l’état de la nature et envoie, avec une certaine probabilité, un signal s S au joueur 2

Le joueur 2, ayant reçu le signal s, et connaissant la loi de proba , entreprends, avec une certaine probabilité, une action a A

Paiement de 1: u(t,s,a), paiement de 2: v(t,s,a)

Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (2)

1 : stratégie mixte de 1: 1(s;t) est la probabilité avec laquelle 1 envoie le signal s lorsqu’il est au nœud t. Evidemment, sS 1(s;t) = 1 pour tout t

2 : stratégie mixte de 2: 2(a;s) est la probabilité avec laquelle 2 choisit l’action a lorsqu’il a reçu un signal s. Ici aussi, aA 2(a;s) = 1 pour tout s

(t;s) croyance probabiliste que 2 attribue au choix de t par la nature conditionnellement à la réception du signal s

' 1

1

)';()'(

);()();(

ttst

tstst

si le dénominateur de cette expression n’est pas nulsi le dénominateur de cette expression est nul,on

veut que (t;s) soit rationalisé par certaines croyances

Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (3)

Une paire de stratégies (1,2) est un équilibre séquentiel si, pour tout t , 1(s;t) > 0 implique que s maximise aA

2(a;s’)u(t,s’,a) et, pour tout s S, 2(a;s) > 0 implique que a maximise t (t;s)v(t,s,a’)

Etant donné un équilibre séquentiel (1,2), on dit du signal s’ qu’il est dominé à l’équilibre conditionnellement à t si : maxsS aA 2(a;s)u(t,s,a) > maxaA 2(a;s’)u(t,s’,a)

Paiement espéré de 1 à l’équilibre séquentiel si la

nature choisit t

meilleur paiement que 1 peut espérer obtenir de l’envoi dusignal s’ après avoir observé t

Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (4)

L’équilibre séquentiel (1,2) viole le critère intuitif de Cho et Kreps s’il existe un nœud t et un signal s’ dominé à l’équilibre conditionnellement à t pour lesquels il est impossible de rationaliser la réponse d’équilibre de 2 au signal s’ avec des croyances probabilistes qui attribuent une probabilité nulle à t.

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Le mieux que 1 puisse faire en annonçant « face » après avoir observépile est 2 (alors qu’elle reçoit 3 en envoyant le signal pile)

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

s’ = « face » est donc dominé à l’équilibre conditionnellement à t = « pile »

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Pour vérifier le critère intuitif, on devrait être capable de rationaliser le choix de « pile » par 2 en réponse à « face » par une croyance qui attribue une probabilité nulle au fait que la nature ait choisi « pile »

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

face

pile

11

face

pileNature

2

2

face

pile

face

pile

face

pile

face

pile

(3,1)

(1,0)

(2,1)

(0,0)

(2,0)

(0,1)

(3,0)

(1,1)

Or nous en sommes incapables!!!

Education et Signal

Le modèle célèbre de Spence (1974) fournit un bel exemple de jeu de signal

Une population de travailleurs se décompose (disons en part égale) en 2 types: 1 (nul) et 2 (talentueux)

Un travailleur connaît son type, l’employeur ne le connaît pas au moment de l’embauche

La productivité d’un travailleur dépend à la fois de son type et de son niveau d’éducation

Productivité d’un travailleur de type t (t = 1,2) est égale à te où e désigne le nombre d’années d’éducation supérieure (disons au dela de la troisième)

Education et Signal (2)

Un travailleur aime le salaire (égal à sa productivité) mais n’aime pas étudier

Les nuls détestent d’avantage les études que les talentueux

Les préférences pour les différentes combinaisons d’éducation (e) et de salaire (w) d’un travailleur de type t sont représentées par la fonction d’utilité ut(e,w)

ut est décroissante en e, croissante en w, et satisfait la condition (Spence Mirlees):

wweu

eweu

wweu

eweu

/),(

/),(

/),(

/),(2

2

1

1

Condition de Spence-Mirlees

éducation

w

e

w0

talentueux

nul

le nul requiert plusde compensation salariale que le

talentueux pour étudier plus

Un équilibre de Spence

Est constitué d’une fonction de salaire w(e) (croissante, et satisfaisant w(e) [e,2e])

De choix de niveaux d’éducation par les 2 types de travailleurs qui maximisent leur utilité, étant donné leur anticipation de la fonction de salaire

La fonction de salaire doit être optimale ex post pour les entreprises (étant donnés les choix éducatifs des travailleurs)

(au moins) deux types d’équilibres sont possibles: Séparateurs, et mélangeant

Equilibre séparateur naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

w(e)

Equilibre séparateur naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

w(e)

cette situation est efficace

Equilibre séparateur naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

w(e)

Chaque type choisit son

niveau d’étude préféré, étant

donné l’impact de celui-ci surla productivité

Equilibre séparateur naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

w(e)

chaque type est content de son sort et n’a pas envie d’imiter

l’autre

Equilibre séparateur naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

w(e)

la fonction de salaire n’est pas contrainte mis à part aux point de

tangence

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

le nul préfère l’effort éducatif et le salaire du talentueux à

celui qu’il choisirait sur sa

droite de productivité

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

si la fonction de salaire passe par

(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé

que celui correspondant à leur productivité

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

si la fonction de salaire passe par

(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé

que celui correspondant à leur productivité

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Mais aucun employeur ne veut payer un nul à un salaire supérieur à

sa productivité

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Si les employeurs ne peuvent observer les type, on ne peut pas

construire une fonction de salaire qui conduit à

des décisions d’éducation efficaces

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

On peut en revanche construire une fonction de salaire qui va séparer les nuls des talentueux

qui entraînera une suréducation des

talentueux

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w2

e2

Voici comment:

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w’2

e2

Voici comment:

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w’2

e2

Voici comment:

e’2

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w’2

e2

En utilisant une fonctionde salaire passant pare1,w1 et par e’2,w’2 et

restant en dessous de la courbe d’indifférence

du nul…

e’2

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w’2

e2

On induit le talentueux et le nul à se séparer

d’une manière compatible avec leur

productivité

e’2

w(e)

Equilibre séparateur pas naturel

éducation

w

e1

w1

w = e

45°

w = 2e

w’2

e2

Mais on induit chez le talentueux un effort

éducatif e’2 “excessif”

e’2

w(e)

Equilibre mélangeant ?

éducation

w

em

wm

w = e

w = 2ew = 3e/2

w(e)

Equilibre mélangeant ?

éducation

w

em

wm

w = e

w = 2ew = 3e/2

w(e)

les 2 types choisissent le même niveau

éducatif em et le même salaire

wm

Equilibre mélangeant ?

éducation

w

em

wm

w = e

w = 2ew = 3e/2

w(e)

wm

Correspond à la Productivité

moyenne dans la population pour le niveau éducatif em

Un seul équilibre séquentiel de Spence satisfait le critère intuitif de

Cho et Kreps:

L’équilibre séparateur où le nul choisit son niveau préféré d’éducation sur sa droite de productivité et le talentueux choisit son niveau préféré d’éducation sur sa droite de productivité parmi les niveaux sur cette droite que le nul n’envie pas

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

Combinaisons surla droite de forte productivité

faiblement dominéespar (e1,w1) pour le nul

et susceptibles d’être choisies par le talentueux

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

Ces combinaisons surla droite de forte productivité

sont aussifaiblement dominéespar (e1,w1) pour le nul

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

mais elles ne sont pas susceptibles d’être choisies par

un talentueuxà cause de la condition de

Spence-Mirlees

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

Quelle combinaison dans cette zone sera choisie par un

talentueux ?

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

Quelle combinaison dans cette zone sera choisie par un

talentueux ?

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

cela dépend des préférences du talentueux!

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

une possibilité est celle-ci

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w

e1

w1

w = e

w = 2e

w’2

e’2

une autre est celle là

Q: pourquoi l’équilibre mélangeant est-il éliminé par

le critère intuitif ?

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

Peut on trouver une fonctionde salaire supportant cetéquilibre et basée sur des

croyances probabilistes satisfaisant le critère de Cho et Kreps ?

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

une telle fonctionde salaire devrait passer

par cette zone

e’2

w’2

e’’2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

en effet, tout niveau éducatif supérieur à e’2,

même payé à un salaire de 2 e’2,

est dominé à l’équilibrepour un nul

e’2

w’2

e’’2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

La seule croyance que peut avoir un employeurobservant un effort

éducatif supérieur à e’2, est que cet effort provient d’un

talentueux avec probabilité 1

e’2

w’2

e’’2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

Mais si la fonctionde salaire passepar cette zone

e’2

w’2

e’’2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

Mais si la fonctionde salaire passepar cette zone

e’2

w’2

e’’2

Considérons un équilibre mélangeant

éducation

w

em

wm

w = e

w = 2ew = 3e/2

Le talentueux n’a pas intérêtà choisir em,wm !!

e’2

w’2

e’’2

Recommended