Jeux sous forme extensive. Objectif u Modéliser des interactions où la structure temporelle et...

Jeux sous forme extensive

Objectif

Modéliser des interactions où la structure temporelle et l’information dont disposent les joueurs paraissent importants.

Structure temporelle: caractère séquentiel des décisions

Information: Ce que le joueur sait lorsqu’il doit décider

Illustration

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

Le caractère séquentiel des décisions est-il important ?

Pas autant qu’on pourrait le croire On peut représenter l’interaction sous-

jacente à cet exemple dans un jeu sous forme normale

On doit pour se faire réinterpréter quelque peu la notion de stratégie

Une stratégie devient un plan d’actions contingents à l’atteinte d’un nœud de décision (ex: la stratégie « guerre » de FT n’a de prise sur le réel que si DT décide d’entrer)

Menace à l’entrée sous forme normale

n’entrepas

guerre paix

(-25,75) (50, 150)

(0,300) (0,300)

Un autre exemple séquentiel (Kreps)

Deux fabricants de jouets A et B envisagent de lancer un jeu différent avant noël.

Si A lance son jeu, il doit dépenser (coûts fixes) 40 000 euros en conception, commercialisation, et production. Le coût correspondant pour B est de 60 000 euros.

Le marché du jouet est incertain. Avec probabilité 2/5, il sera bon (ventes totales de 20 000 unités). Avec probabilité 3/5, il sera mauvais (ventes de 6000 unités).

Un autre exemple séquentiel (Kreps)

Si les 2 firmes lancent le jouet, le prix d’équilibre est de 10 euros. Si une seule des deux firmes lance le jeu, le prix d’équilibre est de 12 euros

Coût marginal de 5 euros pour firme A et 3 euros pour firme B (en + des coûts fixes)

La firme B a un avantage: Elle a fait une étude de marché qui lui permet de connaître avant de lancer son jeu l’état du marché (bon ou mauvais).

Forme extensive

naturenature

good0,4

bad0,6

(0,120)

(0,-6)

(10,10)

(100,0)

(-25,-39)

L’aspect séquentiel: fondamental ?

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

in,in in, out out,in out,outB

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

=0,4x10+0,6x(-25)

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

-11; -19,4 5,2; 4 35;-23,4 41,2;0

0;44,4 0;48 0;-3,6 0,0

Un autre exemple: Information imparfaite

Sylvester aime se battre contre des mauviettes, mais ne sais pas distinguer une mauviette d’un homme viril avant d’engager le combat(en moyenne 2/3 des hommes sont mes mauviettes, 1/3 sont virils)

Sylvester est devant un café et envisage de taper sur la première personne qu’il pense être une mauviette.

Tartarin est dans le café et sait qu’il va passer sur le chemin de Sylvester; Tartarin n’aime pas se battre (qu’il soit ou non une mauviette)

Sylvester peut observer la consommation de Tartarin

Il sait que les mauviettes préfèrent le lait grenadine alors que les hommes virils préfèrent la bière

Forme extensive

faible (2/3)

fort (1/3)

bière

TartarinTartarin

bière

laitNature

Sylvester

combat

(1,-1)

(0,-1)

(-1,1)

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C C,P P,C P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière

lait, bière

C,C 2/3 C,P P,C 1/3 P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait

lait, lait

Forme normale:

bière, bière1/2

lait, bière

C,C 2/3 C,P P,C 1/3 P,PS

-1/3, 1/3 -1/3,1/3 7/3,0 7/3,0

-2/3,1/3 0,1/3 4/3,-1/3 2,0

1/3,1/3 7/3,-1/3 1,2/3 3,0

0,1/3 8/3,0 0,1/3 8/3,0

bière, lait1/2

lait, lait

G = (N, T, , i (.), A(.), α(.), I, U(.), ) N = {1,…,n} ensemble des joueurs (le nème

joueur étant interprété comme étant « la nature » (n > 2))

T = ensemble des nœuds de décision (supposé fini)

est une relation d’arborescence reliant les nœuds entre eux en terme de « postériorité » : t t’ signifie que le nœud t vient après le nœud t’

Propriétés de la relation d’arborescence

La relation stricte est supposée transitive, asymétrique et telle que si t’’ t et t’’ t’, alors t t’ ou t’ t

Ceci n’est pas autorisé:

t’’

Ceci non plus:

t’’

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors: #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »

Proposition: Si satisfait ces propriétés et si t est un nœud dans T tel que {t’ T: t t’} n’est pas vide, alors #{t’ T: t t’ et t’’ t. q. t t’’ t’} = 1

« Un nœud qui n’est pas initial n’a qu’un seul prédécesseur immédiat »

Cette proposition nous permet de « remonter le long de l’arbre des branches à la racine »

W T : L’ensemble des nœuds initiaux (sans prédécesseurs)

Z T : L’ensemble des nœuds finaux (sans successeurs)

X = T\Z L’ensemble des nœuds qui ne sont pas finaux

s(t) = {t’T:t’ t et t t’’ t’’ tel que t’ t’’} (successeurs immédiats de t)

p(t) = {t’T:t t’ et t’’ t t’’ tel que t’’ t’} (prédécesseurs immédiats de t) (singleton)

Jeux sous forme extensive i: X N, une fonction qui associe à chaque

nœud non terminal l’identité du joueur (qui peut être la nature) qui doit jouer à ce nœud

A: X C, une correspondance qui associe à chaque nœud non terminal un ensemble d’actions pouvant être adoptées à ce nœud

Pour tout t X, α: s(t) A(t) (fonction biunivoque, qui associe à chaque successeur immédiat de t l’unique action qui y mène uniquement)

I: Une partition de T en ensembles d’information

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes:

I: Une partition de T en ensemble d’information

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)

I: Une partition de T en ensembles d’information.

N’importe quels nœuds t et t’ appartenant au même ensemble d’information satisfont les deux propriétés suivantes: (a) i(t) = i(t’)

(b) A(t) = A(t’)

U: N\{n}Z fonction de paiement qui associe à chaque joueur (la nature mise à part) et à chaque nœud terminal un paiement numérique

: une fonction qui associe à chaque nœud initial et à chaque nœud où la nature est amenée à jouer une probabilité.

Forme extensive et temporalité

Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »

Forme extensive et temporalité

Les ensembles d’information ne sont pas nécessairement ordonnés par la relation de « postériorité »

S’’

G’’

S’’

G’’

Forme extensive et mémoire

Le formalisme des formes extensives est a priori compatible avec de l’oubli de la part des joueurs

Voici différents types d’oubli

Oubli immédiat d’action passée

Oubli non-immédiat d’action passée

2G D G D

Oubli non-immédiat d’action passée

2G D G D

Le joueur 1 a oublié qu’il a joué g!!

Oubli d’information passée

2G D G D

Oubli d’information passée

2G D G D

1 a oublié ce qu’il savait avant!!!

Hypothèse de mémoire parfaite

On exclut les trois types d’oublis précédents.

Equilibre-parfait en sous-jeu

Le concept clé d’équilibre pour les jeux sous forme extensive est le concept d’équilibre parfait en sous-jeu (subgame perfect equilibrium)

Ce concept est du à Reinhart Selten (prix Nobel)

s’applique surtout à des jeux à information complète

Notion clé: sous jeu

Sous-jeu (définition)

Un sous-jeu d’une forme extensive est un nœud t et tous ses successeurs S(t) qui satisfont la propriété que h(t) = {t} et, pour tout t’ dans S(t), h(t’) S(t)

Sous-jeux (exemple 1)

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

FTguerre

paix(50,150)

(-25,75)

FTguerre

paix(50,150)

(-25,75)

sous-jeu 1

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

sous-jeu 1

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

sous-jeu 1

sous-jeu 2

Un pirate de l’air rationnel veut détourner un avion à destination de Marseille sur Tripoli en menaçant de le faire exploser

La menace n’est pas crédible au sens où le pirate n’a pas intérêt à mettre sa menace à exécution

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,-1)

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,1)

sous-jeu 1

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,-1)

sous-jeu 1

sous jeu 2

Attention pas de sous jeu ici:

Attention: pas de sous-jeu ici:

faible (2/3)

fort (1/3)

bière

TartarinTartarin

bière

laitNature

Sylvester

combat

(1,-1)

(0,-1)

(-1,1)

Equilibre-parfait en sous-jeux

Une combinaison de stratégies behaviorales est un équilibre (de Nash) parfait en sous-jeu si les stratégies sont des équilibres de Nash dans tous les sous-jeux du jeu

Equilibre parfait en sous-jeux (exemple 1)

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

Deux équilibres de Nash de ce jeu:

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

(1) n’entre pas, guerre

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

(1) n’entre pas, guerre (2) entre, paix

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

(1) n’entre pas, guerre (2) entre, paix

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

(2) entre, paix

n’entre pas

FTguerre

(0,300)

(50,150)

(-25,75)

(2) entre, paixSeul celui-ci est parfait en sous jeu

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,-1)

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,-1)

Nash 1: le pilote va à Tripoli, le pirate fait exploser l’avion à Marseille

mais pas à Tripoli

Marseille

Tripoli

pilote

pirate rien

explose

(-1,-1)

explose

pirate

(-1,-1)

Nash 2: le pilote va à Marseille, le pirate ne fait jamais exploser l’avion

Remarque sur la perfection en sous-jeu

Ce concept de solution coincide avec l’élimination itérative des stratégies faiblement dominées lorsque le jeu en forme extensive est représenté en forme normale

Nous l’avons vu avec FT et DT Regardons le avec l’exemple du

pirate de l’air

Forme normale du jeu du pirate de l’air

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Marseille

Tripoli

EE ER RE RR

pirate

-1, -1 -1,-1 1,0 1,0

-1,-1 0,1 -1,-1 0,1pilote

Autres solutions pour des jeux sous forme extensive

La notion de perfection en sous-jeu s’applique principalement à des situations de jeux à information parfaite (ensembles d’information sont des singletons)

Considérons les jeux suivants

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Un équilibre de Nash: D, a, L

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Un autre: A,a,R

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Un autre: A,a,R

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Examinons D, a, L

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Examinons D, a, L

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Cet équilibre n’est pas très plausible car il exige de 2 le choix, à un nœud non-atteint, de a qui ne serait

pas rationnel étant donné le choix de L par 3

Exemple 1

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

On voudrait un critère qui élimine cet équilibre. La notion de perfection en sous-jeu ne peut être utilisée ici

car ce jeu n’a pas de sous-jeu strict

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

A,l est un équilibre de Nash

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

A,l est un équilibre de Nash

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

étant donné le choix de l par 2, 1 préfère jouer A et étantdonné que 1 joue A, les préférences de 2

sur son choix d’action n’ont aucune importance

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Comme dans l’exemple précédent, on ne trouve pas très plausible cet équilibre: 2, s’il devait jouer, devrait choisir r et ce, où qu’il soit dans son ensemble d’information !!

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r

Exemple 2

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Mais si 2 joue r, 1 devrait jouer L, ce qui nous donneun nouvel équilibre de Nash: L,r

Intuition derrière ces exemples

Même idée que pour la perfection en sous-jeu: on se méfie des équilibres qui impliquent des comportements irrationels à des ensembles d’information qui ne sont pas atteints

Difficulté technique: ces ensembles d’information ne sont pas des singletons

Il faut donc formaliser de manière soigneuse les croyances (probabilistes) que peut avoir le joueur d’être aux différents nœuds d’un ensemble d’information

Equilibre séquentiel (Kreps & Wilson (1982)) Vise à traiter de tels exemples Un équilibre séquentiel est constitué, pour

chaque joueur i, de deux ingrédients: 1. un profil de stratégies (mixtes) i qui

prescrit, à toute action a de A(t) où i(t) = i, la probabilité it(a) qu’a l’action a d’être choisie.

2. un système de croyances probabilistes i qui associe, à chaque ensemble d’information h I où i joue, une fonction de probabilité sur les nœuds de h. i(h;t): probabilité qu’attribue i d’être au nœud t, étant donné qu’il est dans l’ensemble d’information h.

Croyances probabilistes ?

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Elles sont triviales pour les joueurs 1 et 2, mais elles doivent être définies pour le joueur 3

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

S’il est amené à jouer, quelle probabilité devrait attribuer 3 au fait d’être à droite ou à gauche ?

Equilibre séquentiel: définition informelle

Un équilibre séquentiel est une combinaison de stratégies mixtes et de croyances telle que, à chaque ensemble d’information h du jeu, le joueur qui décide à cet ensemble le fait optimalement étant donné ce qui a été fait jusque là (compte tenu de ses croyances , et étant donné ce qui sera fait jusqu’à la fin du jeu, tel que spécifié par )

Equilibre séquentiel (illustration 1)

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

(D, a, L) n’est pas un équilibre séquentiel

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

En effet, puisque 3 jouera L, 2 ne devrait pas jouer a s’il était amené à jouer, étant données ses croyances (triviales) d’être à l’unique nœud constitutif de son

ensemble d’information

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

En revanche, A, a, R est un équilibre séquentiel

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

En revanche, A, a, R est un équilibre séquentiel

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Si 1 pense que 2 jouera a et que 3 jouera R, il doit choisir A, étant données ses croyances (triviales)

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Si 2 anticipe que 3 choisira R, il a raison choisir a plutôt que d, étant données ses croyances (triviales) d’être à

l’unique nœud de son ensemble d’information

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

Finalement le choix de R par 3 est rationnel pour ce joueur s’il attribue une probabilité 3 au moins aussi

grande que 3/5 au fait d’être au nœud de droite de son ensemble d’information

A 2 a(3,3,0)

L R L R

(4,4,4) (1,1,1) (5,5,0) (2,2,2)

En effet, si 3 3/5, 32 + (1- 3) (1- 3)4

Paiement espéréavec R

Paiement espéréavec L

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L’équilibre de Nash (A,l) n’est pas séquentiel

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

A est une meilleure réponse à une anticipationde l mais, quelles que soient les croyances que 2 peut

avoir sur le fait d’être à droite ou à gauche de son ensemble d’information, il n’est pas rationnel pour lui de jouer l

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

En revanche, (L, r) est un équilibre séquentiel car si 2 joue r, 1 a intérêt à jouer L et si 1 joue L, 2 a intérêt à jouer r lorsqu’il assigne une probabilité de 1 au fait d’être au nœud de gauche

de son ensemble d’information.

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Cet exemple suggère que des restrictions doivent être imposées aux croyances . Les seules croyances que 2 peut

avoir est qu’il est au nœud de gauche avec probabilité 1

Restrictions sur les croyances probabilistes ?

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

Restrictions sur les croyances probabilistes ?

l r l r

(0,1) (3,2) (-1,3) (1,5)

1(2,6)

L’ensemble d’information de 2 est atteint avec probabilité nulle à la combinaison de stratégies A,l

Limites de l’équilibre séquentiel

Il restreint très peu les croyances que les joueurs peuvent avoir

Considérons les deux exemples suivants

Un équilibre séquentiel pas intuitif

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

(A,r) est un équilibre séquentiel

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

(A,r) est un équilibre séquentiel

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

1 a intérêt à jouer A si elle croit que 2 jouera r.

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

1 a intérêt à jouer A si elle croit que 2 jouera r. Or 2, s’il croit être au nœud de droite de son ensemble

d’information avec une proba supérieure à ¼, a effectivement intérêt à choisir r

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

La croyance probabiliste de 2, si elle n’est pas exclue parla notion de cohérence sous-jacente à l’équilibre

séquentiel, n’est quand même pas « raisonnable »

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

Si 2 se fait donner l’occasion de jouer, il devrait comprendre que cet état de fait résulte d’une

décision du joueur 1 de renoncer à un paiement de 2

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait

donc attribuer une probabilité de 1 au nœud de gauche

l r l r

(5,1) (0,0) (0,0) (1,3)

1(2,2)

A cause de cela, 2 devrait comprendre que si 1 lui a passéla main, ce ne peut être qu’en choisissant L. 2 devrait

donc attribuer une probabilité de 1 au nœud de gauche

On peut voir cela très bien avec la forme normale

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

Nash (séquentiel)

2,2 2,2

5,1 0,0

0,0 1,3

Nash (séquentiel)

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

Strictly dominated

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

Weak domination

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

2,2 2,2

5,1 0,0

0,0 1,3

Un exemple plus délicat: le jeu de la vérité

pile 0,2

face 0,8

pileNature

pile 0,2

face 0,8

pileNature

un équilibre de Nash

pile 0,2

face 0,8

pileNature

1 annonce pile indépendamment du résultat du jetet 2 annonce face si 1 annonce pile et pile si 1 annonce face

pile 0,2

face 0,8

pileNature

1 annonce « pile » indépendamment du résultat du jetet 2 annonce « face » si 1 annonce « pile » et « pile » si 1 annonce « face »

pile 0,2

face 0,8

pileNature

Cette combinaison de stratégies est évidemment un équilibre de Nash (si 1 croit que 2 va dire le contraire de ce qu’elle annonce, elle

a intérêt à dire « pile » indépendamment du jet de la pièce)

pile 0,2

face 0,8

pileNature

(1,1)Si 1 dit « pile » indépendamment du résultat du jet, 2 a intérêt à dire « face » s’il

entend pile car son paiement moyen est plus grand que celui qu’il obtiendrait en disant « pile ». Ce qu’il prévoit de faire s’il entend « face » est sans importance car

cette éventualité ne se produit pas

pile 0,2

face 0,8

pileNature

Evidemment, il faut se demander si le comportement de 2 à l’ensemble d’information non atteint peut être rationalisé par

certaines croyances probabilistes.

pile 0,2

face 0,8

pileNature

C’est le cas! Déclarer « pile » après avoir entendu « face » est rationnel pour 2 si celui-ci croit qu’il y a au moins 1

chance sur 2 que la pièce soit tombée sur « pile »

pile 0,2

face 0,8

pileNature

Question: une telle croyance probabiliste est-elle rationnelle ?

pile 0,2

face 0,8

pileNature

Réponse: Non! 1 a tout intérêt à dire « face » s’il voit « face » et « pile » s’il voit « pile » (il reçoit un bonus pour dire la vérité)

pile 0,2

face 0,8

pileNature

Donc, si 2 entend 1 lui dire « face », il doit conclure qu’il y a au moins 8 chances sur 10 que la pièce soit tombée sur « face »,

dans lequel cas, il devrait plutôt répondre « face »

pile 0,2

face 0,8

pileNature

Autre équilibre séquentiel: 1 annonce « face » indépendamment du résultat du jet et 2 dit la vérité

On voit, ici aussi, cela avec la forme normale

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

dominé par une mixture de FF et PP (proba 3/7 à FF)

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

dominée par FF

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

dominée par FF

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

Dominée par FP

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

14/5,4/5 14/5,4/5 4/5,1/5 4/5,1/5

3,4/5 13/5,1 7/5,0 1,0

2,4/5 2/5,0 8/5,1 0,1/5

11/5,4/5 1/5,1/5 11/5,4/5 1/5,1/5

Formalisons le critère dit « intuitif » de Cho et Kreps (1987)

S’applique à des jeux à 2 joueurs appelés « jeux de signaux »

La nature joue en premier et sélectionne un nœud t dans un ensemble avec une distribution de probabilité

Le joueur 1 est informé de l’état de la nature et envoie, avec une certaine probabilité, un signal s S au joueur 2

Le joueur 2, ayant reçu le signal s, et connaissant la loi de proba , entreprends, avec une certaine probabilité, une action a A

Paiement de 1: u(t,s,a), paiement de 2: v(t,s,a)

Formalisons le critère dit « intuitif » de Cho et Kreps (1987) (2)

1 : stratégie mixte de 1: 1(s;t) est la probabilité avec laquelle 1 envoie le signal s lorsqu’il est au nœud t. Evidemment, sS 1(s;t) = 1 pour tout t

2 : stratégie mixte de 2: 2(a;s) est la probabilité avec laquelle 2 choisit l’action a lorsqu’il a reçu un signal s. Ici aussi, aA 2(a;s) = 1 pour tout s

(t;s) croyance probabiliste que 2 attribue au choix de t par la nature conditionnellement à la réception du signal s

)';()'(

);()();(

si le dénominateur de cette expression n’est pas nulsi le dénominateur de cette expression est nul,on

veut que (t;s) soit rationalisé par certaines croyances

Une paire de stratégies (1,2) est un équilibre séquentiel si, pour tout t , 1(s;t) > 0 implique que s maximise aA

2(a;s’)u(t,s’,a) et, pour tout s S, 2(a;s) > 0 implique que a maximise t (t;s)v(t,s,a’)

Etant donné un équilibre séquentiel (1,2), on dit du signal s’ qu’il est dominé à l’équilibre conditionnellement à t si : maxsS aA 2(a;s)u(t,s,a) > maxaA 2(a;s’)u(t,s’,a)

Paiement espéré de 1 à l’équilibre séquentiel si la

nature choisit t

meilleur paiement que 1 peut espérer obtenir de l’envoi dusignal s’ après avoir observé t

L’équilibre séquentiel (1,2) viole le critère intuitif de Cho et Kreps s’il existe un nœud t et un signal s’ dominé à l’équilibre conditionnellement à t pour lesquels il est impossible de rationaliser la réponse d’équilibre de 2 au signal s’ avec des croyances probabilistes qui attribuent une probabilité nulle à t.

L’équilibre PP, FP viole ce critère intuitif

pile 0,2

face 0,8

pileNature

pile 0,2

face 0,8

pileNature

Le mieux que 1 puisse faire en annonçant « face » après avoir observépile est 2 (alors qu’elle reçoit 3 en envoyant le signal pile)

pile 0,2

face 0,8

pileNature

s’ = « face » est donc dominé à l’équilibre conditionnellement à t = « pile »

pile 0,2

face 0,8

pileNature

Pour vérifier le critère intuitif, on devrait être capable de rationaliser le choix de « pile » par 2 en réponse à « face » par une croyance qui attribue une probabilité nulle au fait que la nature ait choisi « pile »

pile 0,2

face 0,8

pileNature

Or nous en sommes incapables!!!

Education et Signal

Le modèle célèbre de Spence (1974) fournit un bel exemple de jeu de signal

Une population de travailleurs se décompose (disons en part égale) en 2 types: 1 (nul) et 2 (talentueux)

Un travailleur connaît son type, l’employeur ne le connaît pas au moment de l’embauche

La productivité d’un travailleur dépend à la fois de son type et de son niveau d’éducation

Productivité d’un travailleur de type t (t = 1,2) est égale à te où e désigne le nombre d’années d’éducation supérieure (disons au dela de la troisième)

Education et Signal (2)

Un travailleur aime le salaire (égal à sa productivité) mais n’aime pas étudier

Les nuls détestent d’avantage les études que les talentueux

Les préférences pour les différentes combinaisons d’éducation (e) et de salaire (w) d’un travailleur de type t sont représentées par la fonction d’utilité ut(e,w)

ut est décroissante en e, croissante en w, et satisfait la condition (Spence Mirlees):

Condition de Spence-Mirlees

éducation

talentueux

le nul requiert plusde compensation salariale que le

talentueux pour étudier plus

Un équilibre de Spence

Est constitué d’une fonction de salaire w(e) (croissante, et satisfaisant w(e) [e,2e])

De choix de niveaux d’éducation par les 2 types de travailleurs qui maximisent leur utilité, étant donné leur anticipation de la fonction de salaire

La fonction de salaire doit être optimale ex post pour les entreprises (étant donnés les choix éducatifs des travailleurs)

(au moins) deux types d’équilibres sont possibles: Séparateurs, et mélangeant

Equilibre séparateur naturel

éducation

w = 2e

éducation

w = 2e

cette situation est efficace

éducation

w = 2e

Chaque type choisit son

niveau d’étude préféré, étant

donné l’impact de celui-ci surla productivité

éducation

w = 2e

chaque type est content de son sort et n’a pas envie d’imiter

l’autre

éducation

w = 2e

la fonction de salaire n’est pas contrainte mis à part aux point de

tangence

Equilibre séparateur pas naturel

éducation

w = 2e

le nul préfère l’effort éducatif et le salaire du talentueux à

celui qu’il choisirait sur sa

droite de productivité

éducation

w = 2e

si la fonction de salaire passe par

(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé

que celui correspondant à leur productivité

éducation

w = 2e

si la fonction de salaire passe par

(e1,w1) et (e2,w2) les nuls voudront un salaire plus élevé

que celui correspondant à leur productivité

éducation

w = 2e

Mais aucun employeur ne veut payer un nul à un salaire supérieur à

sa productivité

éducation

w = 2e

Si les employeurs ne peuvent observer les type, on ne peut pas

construire une fonction de salaire qui conduit à

des décisions d’éducation efficaces

éducation

w = 2e

On peut en revanche construire une fonction de salaire qui va séparer les nuls des talentueux

qui entraînera une suréducation des

talentueux

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

Voici comment:

éducation

w = 2e

En utilisant une fonctionde salaire passant pare1,w1 et par e’2,w’2 et

restant en dessous de la courbe d’indifférence

du nul…

éducation

w = 2e

On induit le talentueux et le nul à se séparer

d’une manière compatible avec leur

productivité

éducation

w = 2e

Mais on induit chez le talentueux un effort

éducatif e’2 “excessif”

Equilibre mélangeant ?

éducation

w = 2ew = 3e/2

éducation

w = 2ew = 3e/2

les 2 types choisissent le même niveau

éducatif em et le même salaire

éducation

w = 2ew = 3e/2

Correspond à la Productivité

moyenne dans la population pour le niveau éducatif em

Un seul équilibre séquentiel de Spence satisfait le critère intuitif de

Cho et Kreps:

L’équilibre séparateur où le nul choisit son niveau préféré d’éducation sur sa droite de productivité et le talentueux choisit son niveau préféré d’éducation sur sa droite de productivité parmi les niveaux sur cette droite que le nul n’envie pas

Equilibre séquentiel intuitif (Cho et Kreps)

éducation

w = 2e

Combinaisons surla droite de forte productivité

faiblement dominéespar (e1,w1) pour le nul

et susceptibles d’être choisies par le talentueux

éducation

w = 2e

Ces combinaisons surla droite de forte productivité

sont aussifaiblement dominéespar (e1,w1) pour le nul

éducation

w = 2e

mais elles ne sont pas susceptibles d’être choisies par

un talentueuxà cause de la condition de

Spence-Mirlees

éducation

w = 2e

Quelle combinaison dans cette zone sera choisie par un

talentueux ?

éducation

w = 2e

Quelle combinaison dans cette zone sera choisie par un

talentueux ?

éducation

w = 2e

cela dépend des préférences du talentueux!

éducation

w = 2e

une possibilité est celle-ci

éducation

w = 2e

une autre est celle là

Q: pourquoi l’équilibre mélangeant est-il éliminé par

le critère intuitif ?

Considérons un équilibre mélangeant

éducation

w = 2ew = 3e/2

éducation

w = 2ew = 3e/2

Peut on trouver une fonctionde salaire supportant cetéquilibre et basée sur des

croyances probabilistes satisfaisant le critère de Cho et Kreps ?

éducation

w = 2ew = 3e/2

une telle fonctionde salaire devrait passer

par cette zone

e’’2

éducation

w = 2ew = 3e/2

en effet, tout niveau éducatif supérieur à e’2,

même payé à un salaire de 2 e’2,

est dominé à l’équilibrepour un nul

e’’2

éducation

w = 2ew = 3e/2

La seule croyance que peut avoir un employeurobservant un effort

éducatif supérieur à e’2, est que cet effort provient d’un

talentueux avec probabilité 1

e’’2

éducation

w = 2ew = 3e/2

Mais si la fonctionde salaire passepar cette zone

e’’2

éducation

w = 2ew = 3e/2

Mais si la fonctionde salaire passepar cette zone

e’’2

éducation

w = 2ew = 3e/2

Le talentueux n’a pas intérêtà choisir em,wm !!

e’’2

Jeux sous forme extensive. Objectif u Modéliser des interactions où la structure temporelle et...

Documents

Modéliser des processus de type workflow • au sein d ...emmanuel.adam.free.fr/site/IMG/pdf/ConceptionMethodeGLP.pdf · • Modéliser des processus de type workflow • au sein

Co-modéliser les connaissances professorales Basque et Callies · Co-modéliser les connaissances professorales Basque et Callies 5 pour les connaissances stratégiques ou conditionnelles

UML 2 - Modéliser une application web {9782212123890}

Apprenez à modéliser des réseaux SIG intelligents à l’aide

Liste de variétés pour l'arboriculture extensive de

Modéliser et prévoir la persistance bactérienne dans l ......Modéliser et prévoir la persistance bactérienne dans l’environnement des ateliers, un défi insurmontable ? Laurent

Modéliser la ville

Modéliser le comportement des systèmes mécaniques dans le

Comment modéliser la croissance des levures à différentes

Penser, modéliser et maîtriser le calcul informatique

Modéliser une action sur un système

UML : Modéliser la Dynamique

Modéliser le langage

Modéliser en SLCI et NIEUR identifier un modèle de

An extensive study of Web robots trafﬁcpeg.unipv.it/MCC/publications/web-robots-preprint.pdfAn extensive study of Web robots trafﬁc Maria Carla Calzarossa Dip. Ingegneria Industriale

Activité 2 : Exploiter des documents et modéliser afin … · Activité 2 : Exploiter des documents et modéliser afin de omprendre la dynamique des masses d’air. ... les infos

Cycle 2: Analyser, modéliser et étudier le comportement

Approche multi-échelles pour modéliser la pénétration des

Population genomic analysis of elongated skulls reveals extensive female … · Population genomic analysis of elongated skulls reveals extensive female-biased immigration in Early

Made in Germany - Bumm 2020 ENGLISH.pdf · 2021. 3. 30. · MAIN CATALOGUE 2020. 2 Light at close range Light at close range Extensive beam pattern Extensive beam pattern Extensive