Upload
benedict-jacques
View
103
Download
0
Embed Size (px)
Citation preview
Un modèle de rationalité orienté vers la coopération
C. Sibertin-Blanc M. Mailliard
1. La sociologie de l’action organisée: la théorie
sociologique qui inspire
2. Le jeu social
3. Système de règles pour modéliser la rationalité des
acteurs sociaux
4. Adaptation orientée vers la coopération
La Sociologie de l’Action Organisée(ou Analyse Stratégique)
• Héritière de la sociologie des entreprises
Crozier 1962 : le phénomène bureaucratique,
Friedberg 1993 : l’acteur et le système
• Système d’Action Concret :organisation dont les membres sont durablement engagés pour contribuer à la réalisation des objectifs
• Expliquer la nature du comportement des acteurs sociaux
• Rendre compte de la stabilité des rapports sociaux dans les SAC
La Sociologie de l’Action Organisée
• Les acteurs sociaux ont un comportement stratégique :
maintenir ou accroître son pouvoir sur les autres
• Le pourvoir s’exerce par la maîtrise de Zones d’Incertitudes
(une ressource dont d’autres ont besoin)
dont on fixe les termes de l’échange
(la façon dont les autres pourront utiliser)
• Chaque acteur tout à la fois contrôle et est dépendant des autres
• Cette stratégie est mise en œuvre dans le cadre d’une rationalité
limitée
La Sociologie de l’Action Organisée
• Grille d’analyse très largement utilisée par les consultants en
organisation, les sociologues d’entreprise
• Essentiellement empirique
• Notre projet, en collaboration avec des sociologues du CIRESS :
Formaliser cette théorie => laboratoire virtuel
– Méta-modèle de la structure du jeu
– Simulation du comportement des acteurs sociaux
– facteurs endogènes de l’évolution du jeu
Le jeu social : les données
• A = {a1, …, aN}, les acteurs
• R = {r1, …, rM}, les ressources
• Espace des états d’une ressource : [-1, 1]
ter, l’état d’une ressource [-1, 1]
Espace des états du système : [-1, 1]M
• Maîtrise d’une ressource, m : R A
m(r) est l’acteur qui fixe l’état de la ressource r
• Action : déplacement de l’état d’une ressource,
réalisée par l’acteur qui maîtrise cette ressource
Transition : Etat x Action Etat(e1, …, eM) x (d1, …, dM) : (e1 + d1, …, eM + dM)
Le jeu social : les données
• Impact de l’état d’une ressource sur la possibilité d’y accéder
pour un acteur :
effetr (a) : [-1, 1] [-1, 1]
état de r : la façon dont a peut accéder à r
solde de a pour r = effetr(a) (ter) : ce que l’acteur qui maîtrise r octroie à a
• Chaque acteur place des enjeux sur certaines ressources,
en fonction du besoin qu’il en a pour réaliser ses objectifs :
enjeu : A x R [0, 10]
normalisation des enjeux : a A, r R enjeu(a, r) = 10
• La fonction d’utilité de chaque acteur :
satis(a) = r R enjeu(a, r) * effetr(a) (ter)
les moyens dont il dispose pour réaliser ses objectifs
Le jeu social : les règles
• Comportement d’un acteur = valeur qu’il fixe aux termes de
l’échange des ressources qu’il contrôle
• fonctionnement du jeu social : chacun ajuste son comportement
en fonction du comportement des autres
• Jeu stabilisé : les acteurs ne changent plus de comportement,
ils jouent l’action nulle, chacun accepte :– le niveau de sa propre satisfaction
– le niveau de la satisfaction de chacun des autres
• Objectif du jeu : obtenir une forte satisfaction
Le jeu social : les règles
• On cherche un modèle de rationalité des acteurs tq :– le jeux itéré soit stationnaire (les comportements sont stabilisés)
– la satisfaction de chaque acteur est « maximal »
• Pour ne pas faire d’hypothèse sur les règles d’un comportement
social,– chaque acteur construit son propre processus de décision par
apprentissage,
– avec le minimum de connaissance sur la structure du jeu :
• ses enjeux,
• les soldes qu’il reçoit
Le jeu social : Exemple
• Jean et Marie prennent régulièrement l’apéro ensembles,
Jean détient le pastis, Marie les olives
=> A = {J, M}, R = {p, o}, m(p) = J, m(o) = M
• Chacun garde pour lui et donne à l’autre une part +- grande de la
ressource qu’il contrôle
=> effetp(J)(te) = -te = - effetp(M)(te)
effeto(M)(te) = -te = - effeto(J)(te)
• Marie préfère le pastis, Jean préfère les olives
=> enjeu(M, p) = 8, enjeu(M, o) = 2, satis(M) = 8*tep - 2*teo
enjeu(J, o) = 8, enjeu(J, p) = 2, satis(J) = - 2*tep + 8*teo
Tout garder : te = -1
Tout donner : te = 1
Le jeu social : Exemple
C’est un dilemme du prisonnier, dès que chacun place davantage d’enjeux sur la ressource que l’autre contrôle
Matrice des paiements Jeanpour les comportements extrêmes
Marie
Toute valeur de tep dans [-1, 1] correspond à un comportement de J,
de même que pour teo et M
donner
tep= 1
garder
tep= - 1
donner : teo= 1 6, 6 - 10, 10
garder : teo= - 1 10, - 10 - 6, - 6
Un modèle de rationalité :Système de règles
Chaque acteur est muni d’un système de règles de la forme
{situation, action, force}, où :
• situation = liste des soldes qu’il reçoit pour chacune des
ressources dont il a besoin,
(état du système perçu par l’acteur, via les fonctions
d’effet)
• action = liste des déplacements à appliquer aux termes de
l’échange de chacune des ressources qu’il contrôle,
• force : une valeur numérique qui évalue l’efficacité de la règle.
• Cf. les systèmes de classeur
Système de règles
applicables
Système de règles
•Renforcement•- calculer la satisfaction courante et la comparer avec celle de l’étape précédente•- renforcer en conséquence la règle précédemment appliquée : + - bonus•- appliquer un facteur d’oubli à toutes les règles : - oubli•- supprimer les règles dont la force est négative.
Sélection - sélectionner les règles dont la composante situation est proche de la situation courante de l’acteur
- choisir la plus forte parmi elles
- s’il n’y en a pas, créer une nouvelle règle :
(situation courante, action au hasard, force initiale)
Action - apliquer l’action de la règle choisie, ou de celle créée
Système de règles : bilan
• Information dont dispose chaque acteur :– soldes qui lui sont attribués,
– calculer sa satisfaction, et la comparer avec la précédente
• Expérimentations – différentes valeurs des paramètres du système de règles
– variantes du jeu, avec des enjeux différents
ne donnent pas de bonnes conditions:– jeu non stabilisé,
– satisfaction peu élevée.
• Pour obtenir une bonne satisfaction,
la coopération est essentielle dans les jeux à somme non nulle
Inciter à la coopération
• Permettre à chaque acteur de situer sa satisfaction courante dans
le domaine de valeur de sa fonction de satisfaction
satisfaction basse : priorité à l’exploration
satisfaction haute : priorité à l’exploitation,
garder le même comportement => stabilisation du
jeu
• Explorer :– renouveler davantage les règles déterminé par bonus, oubli, force
initiale.
– actions plus énergiques
• Pb : où placer la frontière exploration / exploitation ?
Inciter à la coopérationLa frontière exploration / exploitation
• Critère 1 : elle doit être aussi haute que le niveau de satisfaction auquel
chacun peut prétendre
• Critère 2 : pour que le système se stabilise, elle doit descendre
suffisamment bas pour que chacun cesse d’explorer
=> Chaque acteur a son propre seuil, qui décroît progressivement
seuil_sat := satisfaction_max ‘initialisation
seuil_satn = seuil_satn-1 + *(satisn-1 - seuil_satn-1)
avec = 1/Πa contrôle r nombre_d_état(r)
Inciter à la coopération :explorer / exploiter
• Oubli des règles- en-dessous de seuil_sat : proportionnel à (seuil_sat – satis)
- au-dessus de seuil_sat : pas d’oubli
• Renforcement des règles tq satisn = satisn-1
- en-dessous de seuil_sat : pénalisée
- au-dessus de seuil_sat : renforcée
• Intensité de l’action des règles créées- en-dessous de seuil_sat : déplacement important des termes de l’échange
(modifie significativement l’état du jeu)
- au-dessus de seuil_sat : négligeable (stabiliser l’état du jeu)
Inciter à la coopération :résultats
moyenne ecarttype688,72 330,41
Convergence
-4
-2
0
2
4
6
8
10
12
1 5 9
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
simulations
te d
es r
esso
urce
s
-20
0
20
40
60
80
100
120
140
som
me
sati
sfac
tion
s
pastis
olives
somme satis
Tout donner
Optimum de Pareto
temps moyen de stabilisation 688,7
satisfactionsomme satisfactions
maximum 100 maximum (Pareto) 120minimum -100 minimum (Nash) -120moyenne 31,3 moyenne 72,6
Conclusion
• Structure de jeu particulière, dont les propriétés restent à explorer
• Rationalité qui cherche à atteindre un optimum de Pareto,
plutôt qu’un équilibre de Nash
• Etudier d’autres rationalités :– l’optimum global
– écart type minimum (réduire les inégalités)
– maximiser la satisfaction minimal
JEAN MARIEOLIVE
PASTIS
DONNE
DONNE PREND
PREND
OLIVEPASTIS
La Sociologie de l’Action Organisée
Organization
individual actor
individual actor interaction,
balance
buildconstraintbuild
individual actor