View
109
Download
0
Category
Preview:
Citation preview
Jeux sous forme extensive
Objectif
Modéliser des interactions où la structure temporelle et l’information dont disposent les joueurs paraissent importants.
Structure temporelle: caractère séquentiel des décisions
Information: Ce que le joueur sait lorsqu’il doit décider
Illustration
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Le caractère séquentiel des décisions est-il important ?
Pas autant qu’on pourrait le croire On peut représenter l’interaction sous-
jacente à cet exemple dans un jeu sous forme normale
On doit pour se faire réinterpréter quelque peu la notion de stratégie
Une stratégie devient un plan d’actions contingents à l’atteinte d’un nœud de décision (ex: la stratégie « guerre » de FT n’a de prise sur le réel que si DT décide d’entrer)
Menace à l’entrée sous forme normale
Entre
n’entrepas
guerre paix
FT
DT
(-25,75) (50, 150)
(0,300) (0,300)
Un autre exemple séquentiel (Kreps)
Deux fabricants de jouets A et B envisagent de lancer un jeu différent avant noël.
Si A lance son jeu, il doit dépenser (coûts fixes) 40 000 euros en conception, commercialisation, et production. Le coût correspondant pour B est de 60 000 euros.
Le marché du jouet est incertain. Avec probabilité 2/5, il sera bon (ventes totales de 20 000 unités). Avec probabilité 3/5, il sera mauvais (ventes de 6000 unités).
Un autre exemple séquentiel (Kreps)
Si les 2 firmes lancent le jouet, le prix d’équilibre est de 10 euros. Si une seule des deux firmes lance le jeu, le prix d’équilibre est de 12 euros
Coût marginal de 5 euros pour firme A et 3 euros pour firme B (en + des coûts fixes)
La firme B a un avantage: Elle a fait une étude de marché qui lui permet de connaître avant de lancer son jeu l’état du marché (bon ou mauvais).
Forme extensive
inout
good
bad
0,4
0,6
naturenature
good0,4
bad0,6
A
B B
B B
in
out
in
out
in
out
in
out
(0,120)
(0,0)
(0,-6)
(0,0)
(10,10)
(100,0)
(-25,-39)
(2,0)
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
=0,4x10+0,6x(-25)
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
L’aspect séquentiel: fondamental ?
-11; -19,4 5,2; 4 35;-23,4 41,2;0
0;44,4 0;48 0;-3,6 0,0
in
out
in,in in, out out,in out,outB
A
Un autre exemple: Information imparfaite
Sylvester aime se battre contre des mauviettes, mais ne sais pas distinguer une mauviette d’un homme viril avant d’engager le combat(en moyenne 2/3 des hommes sont mes mauviettes, 1/3 sont virils)
Sylvester est devant un café et envisage de taper sur la première personne qu’il pense être une mauviette.
Tartarin est dans le café et sait qu’il va passer sur le chemin de Sylvester; Tartarin n’aime pas se battre (qu’il soit ou non une mauviette)
Sylvester peut observer la consommation de Tartarin
Il sait que les mauviettes préfèrent le lait grenadine alors que les hommes virils préfèrent la bière
Forme extensive
faible (2/3)
fort (1/3)
bière
lait
TartarinTartarin
bière
laitNature
Sylvester
Sylvester
combat
paix
combat
paix
combat
paix
combat
paix
(1,-1)
(3,0)
(0,-1)
(2,0)
(-1,1)
(2,0)
(0,1)
(3,0)
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C C,P P,C P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière
lait, bière
C,C 2/3 C,P P,C 1/3 P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait
lait, lait
Forme normale:
bière, bière1/2
lait, bière
C,C 2/3 C,P P,C 1/3 P,PS
-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0
-2/3,1/3 0,1/3 4/3,-1/3 2,0
1/3,1/3 7/3,-1/3 1,2/3 3,0
0,1/3 8/3,0 0,1/3 8/3,0
bière, lait1/2
lait, lait
Jeux sous forme extensive
G = (N, T, , i (.), A(.), α(.), I, U(.), ) N = {1,…,n} ensemble des joueurs (le nème
joueur étant interprété comme étant « la nature » (n > 2))
T = ensemble des nœuds de décision (supposé fini)
est une relation d’arborescence reliant les nœuds entre eux en terme de « postériorité » : t t’ signifie que le nœud t vient après le nœud t’
Propriétés de la relation d’arborescence
La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t
Propriétés de la relation d’arborescence
La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t
Ceci n’est pas autorisé:
t’
t
t’’
Propriétés de la relation d’arborescence
La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t
Ceci non plus:
t’
t
t’’
Propriétés de la relation d’arborescence
Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors: #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1
Propriétés de la relation d’arborescence
Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1
« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »
Propriétés de la relation d’arborescence
Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1
« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »
Cette proposition nous permet de « remonter le long de l’arbre des branches à la racine »
Propriétés de la relation d’arborescence
W T : L’ensemble des nœuds initiaux (sans prédécesseurs)
Z T : L’ensemble des nœuds finaux (sans successeurs)
X = T\Z L’ensemble des nœuds qui ne sont pas finaux
s(t) = {t’T:t’ t et t t’’ t’’ tel que t’ t’’} (successeurs immédiats de t)
p(t) = {t’T:t t’ et t’’ t t’’ tel que t’’ t’} (prédécesseurs immédiats de t) (singleton)
Jeux sous forme extensive i: X N, une fonction qui associe à chaque
nœud non terminal l’identité du joueur (qui peut être la nature) qui doit jouer à ce nœud
A: X C, une correspondance qui associe à chaque nœud non terminal un ensemble d’actions pouvant être adoptées à ce nœud
Pour tout t X, α: s(t) A(t) (fonction biunivoque, qui associe à chaque successeur immédiat de t l’unique action qui y mène uniquement)
Jeux sous forme extensive
I: Une partition de T en ensembles d’information
N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes:
Jeux sous forme extensive
I: Une partition de T en ensemble d’information
N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)
Jeux sous forme extensive
I: Une partition de T en ensembles d’information.
N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)
(b) A(t) = A(t’)
Jeux sous forme extensive
U: N\{n}Z fonction de paiement qui associe à chaque joueur (la nature mise à part) et à chaque nœud terminal un paiement numérique
: une fonction qui associe à chaque nœud initial et à chaque nœud où la nature est amenée à jouer une probabilité.
Forme extensive et temporalité
Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »
Forme extensive et temporalité
Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »
2
3
1
1/2
1/2 S
GG
S
S’’
G’’
S’’
G’’
G’
S’
G’
S’
Forme extensive et mémoire
Le formalisme des formes extensives est a priori compatible avec de l’oubli de la part des joueurs
Voici différents types d’oubli
Oubli immédiat d’action passée
Oubli non-immédiat d’action passée
g d
1
2G D G D
1
Oubli non-immédiat d’action passée
g d
1
2G D G D
1
Le joueur 1 a oublié qu’il a joué g!!
Oubli d’information passée
b b
1
2G D G D
1
1d g
Oubli d’information passée
b b
1
2G D G D
1
1d g
1 a oublié ce qu’il savait avant!!!
Hypothèse de mémoire parfaite
On exclut les trois types d’oublis précédents.
Equilibre-parfait en sous-jeu
Le concept clé d’équilibre pour les jeux sous forme extensive est le concept d’équilibre parfait en sous-jeu (subgame perfect equilibrium)
Ce concept est du à Reinhart Selten (prix Nobel)
s’applique surtout à des jeux à information complète
Notion clé: sous jeu
Sous-jeu (définition)
Un sous-jeu d’une forme extensive est un nœud t et tous ses successeurs S(t) qui satisfont la propriété que h(t) = {t} et, pour tout t’ dans S(t), h(t’) S(t)
Sous-jeux (exemple 1)
Sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Sous-jeux (exemple 1)
FTguerre
paix(50,150)
(-25,75)
Sous-jeux (exemple 1)
FTguerre
paix(50,150)
(-25,75)
sous-jeu 1
Sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
sous-jeu 1
Sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
sous-jeu 1
sous-jeu 2
Sous-jeux (exemple 2)
Un pirate de l’air rationnel veut détourner un avion à destination de Marseille sur Tripoli en menaçant de le faire exploser
La menace n’est pas crédible au sens où le pirate n’a pas intérêt à mettre sa menace à exécution
Sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,-1)
Sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,1)
sous-jeu 1
Sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,-1)
sous-jeu 1
sous jeu 2
Attention pas de sous jeu ici:
Attention: pas de sous-jeu ici:
faible (2/3)
fort (1/3)
bière
lait
TartarinTartarin
bière
laitNature
Sylvester
Sylvester
combat
paix
combat
paix
combat
paix
combat
paix
(1,-1)
(3,0)
(0,-1)
(2,0)
(-1,1)
(2,0)
(0,1)
(3,0)
Equilibre-parfait en sous-jeux
Une combinaison de stratégies behaviorales est un équilibre (de Nash) parfait en sous-jeu si les stratégies sont des équilibres de Nash dans tous les sous-jeux du jeu
Equilibre parfait en sous-jeux (exemple 1)
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
(1) n’entre pas, guerre
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
(1) n’entre pas, guerre (2) entre, paix
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
(1) n’entre pas, guerre (2) entre, paix
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
(2) entre, paix
Equilibre parfait en sous-jeux (exemple 1)
entre
n’entre pas
DT
FTguerre
paix
(0,300)
(50,150)
(-25,75)
Deux équilibres de Nash de ce jeu:
(2) entre, paixSeul celui-ci est parfait en sous jeu
Equilibre parfait en sous-jeux (exemple 2)
Equilibre parfait en sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,-1)
Equilibre parfait en sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,-1)
Nash 1: le pilote va à Tripoli, le pirate fait exploser l’avion à Marseille
mais pas à Tripoli
Equilibre parfait en sous-jeux (exemple 2)
Marseille
Tripoli
pilote
pirate rien
explose
(0,1)
(-1,-1)
(1,0)
rien
explose
pirate
(-1,-1)
Nash 2: le pilote va à Marseille, le pirate ne fait jamais exploser l’avion
Remarque sur la perfection en sous-jeu
Ce concept de solution coincide avec l’élimination itérative des stratégies faiblement dominées lorsque le jeu en forme extensive est représenté en forme normale
Nous l’avons vu avec FT et DT Regardons le avec l’exemple du
pirate de l’air
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Forme normale du jeu du pirate de l’air
Marseille
Tripoli
EE ER RE RR
pirate
-1, -1 -1,-1 1,0 1,0
-1,-1 0,1 -1,-1 0,1pilote
Autres solutions pour des jeux sous forme extensive
La notion de perfection en sous-jeu s’applique principalement à des situations de jeux à information parfaite (ensembles d’information sont des singletons)
Considérons les jeux suivants
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Un équilibre de Nash: D, a, L
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Un équilibre de Nash: D, a, L
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Un équilibre de Nash: D, a, L
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Un équilibre de Nash: D, a, L
Un autre: A,a,R
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Un équilibre de Nash: D, a, L
Un autre: A,a,R
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Examinons D, a, L
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Examinons D, a, L
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Cet équilibre n’est pas très plausible car il exige de 2 le choix, à un nœud non-atteint, de a qui ne serait
pas rationnel étant donné le choix de L par 3
Exemple 1
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
On voudrait un critère qui élimine cet équilibre. La notion de perfection en sous-jeu ne peut être utilisée ici
car ce jeu n’a pas de sous-jeu strict
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
A,l est un équilibre de Nash
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
A,l est un équilibre de Nash
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
étant donné le choix de l par 2, 1 préfère jouer A et étantdonné que 1 joue A, les préférences de 2
sur son choix d’action n’ont aucune importance
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Comme dans l’exemple précédent, on ne trouve pas très plausible cet équilibre: 2, s’il devait jouer, devrait choisir r et ce, où qu’il soit dans son ensemble d’information !!
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r
Exemple 2
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r
Intuition derrière ces exemples
Même idée que pour la perfection en sous-jeu: on se méfie des équilibres qui impliquent des comportements irrationels à des ensembles d’information qui ne sont pas atteints
Difficulté technique: ces ensembles d’information ne sont pas des singletons
Il faut donc formaliser de manière soigneuse les croyances (probabilistes) que peut avoir le joueur d’être aux différents nœuds d’un ensemble d’information
Equilibre séquentiel (Kreps & Wilson (1982)) Vise à traiter de tels exemples Un équilibre séquentiel est constitué, pour
chaque joueur i, de deux ingrédients: 1. un profil de stratégies (mixtes) i qui
prescrit, à toute action a de A(t) où i(t) = i, la probabilité it(a) qu’a l’action a d’être choisie.
2. un système de croyances probabilistes i qui associe, à chaque ensemble d’information h I où i joue, une fonction de probabilité sur les nœuds de h. i(h;t): probabilité qu’attribue i d’être au nœud t, étant donné qu’il est dans l’ensemble d’information h.
Croyances probabilistes ?
Croyances probabilistes ?
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Croyances probabilistes ?
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Elles sont triviales pour les joueurs 1 et 2, mais elles doivent être définies pour le joueur 3
Croyances probabilistes ?
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
S’il est amené à jouer, quelle probabilité devrait attribuer 3 au fait d’être à droite ou à gauche ?
Equilibre séquentiel: définition informelle
Un équilibre séquentiel est une combinaison de stratégies mixtes et de croyances telle que, à chaque ensemble d’information h du jeu, le joueur qui décide à cet ensemble le fait optimalement étant donné ce qui a été fait jusque là (compte tenu de ses croyances , et étant donné ce qui sera fait jusqu’à la fin du jeu, tel que spécifié par )
Equilibre séquentiel (illustration 1)
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
(D, a, L) n’est pas un équilibre séquentiel
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
En effet, puisque 3 jouera L, 2 ne devrait pas jouer a s’il était amené à jouer, étant données ses croyances (triviales) d’être à l’unique nœud constitutif de son
ensemble d’information
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
En revanche, A, a, R est un équilibre séquentiel
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
En revanche, A, a, R est un équilibre séquentiel
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Si 1 pense que 2 jouera a et que 3 jouera R, il doit choisir A, étant données ses croyances (triviales)
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Si 2 anticipe que 3 choisira R, il a raison choisir a plutôt que d, étant données ses croyances (triviales) d’être à
l’unique nœud de son ensemble d’information
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
Finalement le choix de R par 3 est rationnel pour ce joueur s’il attribue une probabilité 3 au moins aussi
grande que 3/5 au fait d’être au nœud de droite de son ensemble d’information
Equilibre séquentiel (illustration 1)
1
D
A 2 a(3,3,0)
3
L R L R
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
d
En effet, si 3 3/5, 32 + (1- 3) (1- 3)4
Paiement espéréavec R
Paiement espéréavec L
Equilibre séquentiel (illustration 2)
Equilibre séquentiel (illustration 2)
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Equilibre séquentiel (illustration 2)
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
L’équilibre de Nash (A,l) n’est pas séquentiel
Equilibre séquentiel (illustration 2)
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
A est une meilleure réponse à une anticipationde l mais, quelles que soient les croyances que 2 peut
avoir sur le fait d’être à droite ou à gauche de son ensemble d’information, il n’est pas rationnel pour lui de jouer l
Equilibre séquentiel (illustration 2)
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
En revanche, (L, r) est un équilibre séquentiel car si 2 joue r, 1 a intérêt à jouer L et si 1 joue L, 2 a intérêt à jouer r lorsqu’il assigne une probabilité de 1 au fait d’être au nœud de gauche
de son ensemble d’information.
Equilibre séquentiel (illustration 2)
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Cet exemple suggère que des restrictions doivent être imposées aux croyances . Les seules croyances que 2 peut
avoir est qu’il est au nœud de gauche avec probabilité 1
Restrictions sur les croyances probabilistes ?
Restrictions sur les croyances probabilistes ?
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
Restrictions sur les croyances probabilistes ?
2
l r l r
(0,1) (3,2) (-1,3) (1,5)
1(2,6)
L R
A
L’ensemble d’information de 2 est atteint avec probabilité nulle à la combinaison de stratégies A,l
Limites de l’équilibre séquentiel
Il restreint très peu les croyances que les joueurs peuvent avoir
Considérons les deux exemples suivants
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
(A,r) est un équilibre séquentiel
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
(A,r) est un équilibre séquentiel
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
1 a intérêt à jouer A si elle croit que 2 jouera r.
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
1 a intérêt à jouer A si elle croit que 2 jouera r. Or 2, s’il croit être au nœud de droite de son ensemble
d’information avec une proba supérieure à ¼, a effectivement intérêt à choisir r
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
La croyance probabiliste de 2, si elle n’est pas exclue parla notion de cohérence sous-jacente à l’équilibre
séquentiel, n’est quand même pas « raisonnable »
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
Si 2 se fait donner l’occasion de jouer, il devrait comprendre que cet état de fait résulte d’une
décision du joueur 1 de renoncer à un paiement de 2
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait
donc attribuer une probabilité de 1 au nœud de gauche
Un équilibre séquentiel pas intuitif
2
l r l r
(5,1) (0,0) (0,0) (1,3)
1(2,2)
L R
A
A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait
donc attribuer une probabilité de 1 au nœud de gauche
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
Nash (séquentiel)
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
Nash (séquentiel)
Nash (séquentiel)
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
Strictly dominated
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
Weak domination
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
On peut voir cela très bien avec la forme normale
2,2 2,2
5,1 0,0
0,0 1,3
A
B
C
l r
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
un équilibre de Nash
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
1 annonce pile indépendamment du résultat du jetet 2 annonce face si 1 annonce pile et pile si 1 annonce face
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
1 annonce « pile » indépendamment du résultat du jetet 2 annonce « face » si 1 annonce « pile » et « pile » si 1 annonce « face »
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Cette combinaison de stratégies est évidemment un équilibre de Nash (si 1 croit que 2 va dire le contraire de ce qu’elle annonce, elle
a intérêt à dire « pile » indépendamment du jet de la pièce)
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)Si 1 dit « pile » indépendamment du résultat du jet, 2 a intérêt à dire « face » s’il
entend pile car son paiement moyen est plus grand que celui qu’il obtiendrait en disant « pile ». Ce qu’il prévoit de faire s’il entend « face » est sans importance car
cette éventualité ne se produit pas
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Evidemment, il faut se demander si le comportement de 2 à l’ensemble d’information non atteint peut être rationalisé par
certaines croyances probabilistes.
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
C’est le cas! Déclarer « pile » après avoir entendu « face » est rationnel pour 2 si celui-ci croit qu’il y a au moins 1
chance sur 2 que la pièce soit tombée sur « pile »
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Question: une telle croyance probabiliste est-elle rationnelle ?
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Réponse: Non! 1 a tout intérêt à dire « face » s’il voit « face » et « pile » s’il voit « pile » (il reçoit un bonus pour dire la vérité)
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Donc, si 2 entend 1 lui dire « face », il doit conclure qu’il y a au moins 8 chances sur 10 que la pièce soit tombée sur « face »,
dans lequel cas, il devrait plutôt répondre « face »
Un exemple plus délicat: le jeu de la vérité
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Autre équilibre séquentiel: 1 annonce « face » indépendamment du résultat du jet et 2 dit la vérité
On voit, ici aussi, cela avec la forme normale
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
dominé par une mixture de FF et PP (proba 3/7 à FF)
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
dominée par FF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
dominée par FF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
Dominée par FP
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
On voit, ici aussi, cela avec la forme normale
FF
FF PP
14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5
3,4/5 13/5,1 7/5,0 1,0
2,4/5 2/5,0 8/5,1 0,1/5
11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5
FP
PF
PP
FP PF
Formalisons le critère dit « intuitif » de Cho et Kreps (1987)
S’applique à des jeux à 2 joueurs appelés « jeux de signaux »
La nature joue en premier et sélectionne un nœud t dans un ensemble avec une distribution de probabilité
Le joueur 1 est informé de l’état de la nature et envoie, avec une certaine probabilité, un signal s S au joueur 2
Le joueur 2, ayant reçu le signal s, et connaissant la loi de proba , entreprends, avec une certaine probabilité, une action a A
Paiement de 1: u(t,s,a), paiement de 2: v(t,s,a)
Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (2)
1 : stratégie mixte de 1: 1(s;t) est la probabilité avec laquelle 1 envoie le signal s lorsqu’il est au nœud t. Evidemment, sS 1(s;t) = 1 pour tout t
2 : stratégie mixte de 2: 2(a;s) est la probabilité avec laquelle 2 choisit l’action a lorsqu’il a reçu un signal s. Ici aussi, aA 2(a;s) = 1 pour tout s
(t;s) croyance probabiliste que 2 attribue au choix de t par la nature conditionnellement à la réception du signal s
' 1
1
)';()'(
);()();(
ttst
tstst
si le dénominateur de cette expression n’est pas nulsi le dénominateur de cette expression est nul,on
veut que (t;s) soit rationalisé par certaines croyances
Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (3)
Une paire de stratégies (1,2) est un équilibre séquentiel si, pour tout t , 1(s;t) > 0 implique que s maximise aA
2(a;s’)u(t,s’,a) et, pour tout s S, 2(a;s) > 0 implique que a maximise t (t;s)v(t,s,a’)
Etant donné un équilibre séquentiel (1,2), on dit du signal s’ qu’il est dominé à l’équilibre conditionnellement à t si : maxsS aA 2(a;s)u(t,s,a) > maxaA 2(a;s’)u(t,s’,a)
Paiement espéré de 1 à l’équilibre séquentiel si la
nature choisit t
meilleur paiement que 1 peut espérer obtenir de l’envoi dusignal s’ après avoir observé t
Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (4)
L’équilibre séquentiel (1,2) viole le critère intuitif de Cho et Kreps s’il existe un nœud t et un signal s’ dominé à l’équilibre conditionnellement à t pour lesquels il est impossible de rationaliser la réponse d’équilibre de 2 au signal s’ avec des croyances probabilistes qui attribuent une probabilité nulle à t.
L’équilibre PP, FP viole ce critère intuitif
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
L’équilibre PP, FP viole ce critère intuitif
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Le mieux que 1 puisse faire en annonçant « face » après avoir observépile est 2 (alors qu’elle reçoit 3 en envoyant le signal pile)
L’équilibre PP, FP viole ce critère intuitif
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
s’ = « face » est donc dominé à l’équilibre conditionnellement à t = « pile »
L’équilibre PP, FP viole ce critère intuitif
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Pour vérifier le critère intuitif, on devrait être capable de rationaliser le choix de « pile » par 2 en réponse à « face » par une croyance qui attribue une probabilité nulle au fait que la nature ait choisi « pile »
L’équilibre PP, FP viole ce critère intuitif
pile 0,2
face 0,8
face
pile
11
face
pileNature
2
2
face
pile
face
pile
face
pile
face
pile
(3,1)
(1,0)
(2,1)
(0,0)
(2,0)
(0,1)
(3,0)
(1,1)
Or nous en sommes incapables!!!
Education et Signal
Le modèle célèbre de Spence (1974) fournit un bel exemple de jeu de signal
Une population de travailleurs se décompose (disons en part égale) en 2 types: 1 (nul) et 2 (talentueux)
Un travailleur connaît son type, l’employeur ne le connaît pas au moment de l’embauche
La productivité d’un travailleur dépend à la fois de son type et de son niveau d’éducation
Productivité d’un travailleur de type t (t = 1,2) est égale à te où e désigne le nombre d’années d’éducation supérieure (disons au dela de la troisième)
Education et Signal (2)
Un travailleur aime le salaire (égal à sa productivité) mais n’aime pas étudier
Les nuls détestent d’avantage les études que les talentueux
Les préférences pour les différentes combinaisons d’éducation (e) et de salaire (w) d’un travailleur de type t sont représentées par la fonction d’utilité ut(e,w)
ut est décroissante en e, croissante en w, et satisfait la condition (Spence Mirlees):
wweu
eweu
wweu
eweu
/),(
/),(
/),(
/),(2
2
1
1
Condition de Spence-Mirlees
éducation
w
e
w0
talentueux
nul
le nul requiert plusde compensation salariale que le
talentueux pour étudier plus
Un équilibre de Spence
Est constitué d’une fonction de salaire w(e) (croissante, et satisfaisant w(e) [e,2e])
De choix de niveaux d’éducation par les 2 types de travailleurs qui maximisent leur utilité, étant donné leur anticipation de la fonction de salaire
La fonction de salaire doit être optimale ex post pour les entreprises (étant donnés les choix éducatifs des travailleurs)
(au moins) deux types d’équilibres sont possibles: Séparateurs, et mélangeant
Equilibre séparateur naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
w(e)
Equilibre séparateur naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
w(e)
cette situation est efficace
Equilibre séparateur naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
w(e)
Chaque type choisit son
niveau d’étude préféré, étant
donné l’impact de celui-ci surla productivité
Equilibre séparateur naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
w(e)
chaque type est content de son sort et n’a pas envie d’imiter
l’autre
Equilibre séparateur naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
w(e)
la fonction de salaire n’est pas contrainte mis à part aux point de
tangence
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
le nul préfère l’effort éducatif et le salaire du talentueux à
celui qu’il choisirait sur sa
droite de productivité
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
si la fonction de salaire passe par
(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé
que celui correspondant à leur productivité
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
si la fonction de salaire passe par
(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé
que celui correspondant à leur productivité
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Mais aucun employeur ne veut payer un nul à un salaire supérieur à
sa productivité
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Si les employeurs ne peuvent observer les type, on ne peut pas
construire une fonction de salaire qui conduit à
des décisions d’éducation efficaces
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
On peut en revanche construire une fonction de salaire qui va séparer les nuls des talentueux
qui entraînera une suréducation des
talentueux
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w2
e2
Voici comment:
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w’2
e2
Voici comment:
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w’2
e2
Voici comment:
e’2
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w’2
e2
En utilisant une fonctionde salaire passant pare1,w1 et par e’2,w’2 et
restant en dessous de la courbe d’indifférence
du nul…
e’2
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w’2
e2
On induit le talentueux et le nul à se séparer
d’une manière compatible avec leur
productivité
e’2
w(e)
Equilibre séparateur pas naturel
éducation
w
e1
w1
w = e
45°
w = 2e
w’2
e2
Mais on induit chez le talentueux un effort
éducatif e’2 “excessif”
e’2
w(e)
Equilibre mélangeant ?
éducation
w
em
wm
w = e
w = 2ew = 3e/2
w(e)
Equilibre mélangeant ?
éducation
w
em
wm
w = e
w = 2ew = 3e/2
w(e)
les 2 types choisissent le même niveau
éducatif em et le même salaire
wm
Equilibre mélangeant ?
éducation
w
em
wm
w = e
w = 2ew = 3e/2
w(e)
wm
Correspond à la Productivité
moyenne dans la population pour le niveau éducatif em
Un seul équilibre séquentiel de Spence satisfait le critère intuitif de
Cho et Kreps:
L’équilibre séparateur où le nul choisit son niveau préféré d’éducation sur sa droite de productivité et le talentueux choisit son niveau préféré d’éducation sur sa droite de productivité parmi les niveaux sur cette droite que le nul n’envie pas
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
Combinaisons surla droite de forte productivité
faiblement dominéespar (e1,w1) pour le nul
et susceptibles d’être choisies par le talentueux
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
Ces combinaisons surla droite de forte productivité
sont aussifaiblement dominéespar (e1,w1) pour le nul
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
mais elles ne sont pas susceptibles d’être choisies par
un talentueuxà cause de la condition de
Spence-Mirlees
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
Quelle combinaison dans cette zone sera choisie par un
talentueux ?
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
Quelle combinaison dans cette zone sera choisie par un
talentueux ?
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
cela dépend des préférences du talentueux!
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
une possibilité est celle-ci
Equilibre séquentiel intuitif (Cho et Kreps)
éducation
w
e1
w1
w = e
w = 2e
w’2
e’2
une autre est celle là
Q: pourquoi l’équilibre mélangeant est-il éliminé par
le critère intuitif ?
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
Peut on trouver une fonctionde salaire supportant cetéquilibre et basée sur des
croyances probabilistes satisfaisant le critère de Cho et Kreps ?
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
une telle fonctionde salaire devrait passer
par cette zone
e’2
w’2
e’’2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
en effet, tout niveau éducatif supérieur à e’2,
même payé à un salaire de 2 e’2,
est dominé à l’équilibrepour un nul
e’2
w’2
e’’2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
La seule croyance que peut avoir un employeurobservant un effort
éducatif supérieur à e’2, est que cet effort provient d’un
talentueux avec probabilité 1
e’2
w’2
e’’2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
Mais si la fonctionde salaire passepar cette zone
e’2
w’2
e’’2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
Mais si la fonctionde salaire passepar cette zone
e’2
w’2
e’’2
Considérons un équilibre mélangeant
éducation
w
em
wm
w = e
w = 2ew = 3e/2
Le talentueux n’a pas intérêtà choisir em,wm !!
e’2
w’2
e’’2
Recommended