Dans cette section, on étudie la combinaison de stratégies appelée stratégie de coopération qui supporte un équilibre parfait en sous jeu symétrique qui consiste à coopérer en première étape du jeu et à sanctionner tous ceux qui n’ont pas coopéré, sauf si l’on a dévié de la stratégie d’équilibre à la première étape ; dans ce cas, on dévie également en deuxième étape. A l’équilibre, tous les sujets coopèrent à la production de l’output et personne n’est donc sanctionné en deuxième étape du jeu. Si un joueur dévie de l’équilibre, les autres continuent de coopérer mais le sanctionnent.
Proposition 2 : lorsque les agents sont suffisamment averses à l’inégalité, l’opportunité de sanctionner ses pairs permet d’atteindre la coopération.
Preuve : Contrairement au modèle sans pression des pairs, l’opportunité de sanctionner permet aux sujets de réduire l’inégalité ressentie sans avoir à réduire son propre effort de production. L’induction à rebours est utilisée pour vérifier que la combinaison des stratégies consistant à coopérer et à sanctionner tous ceux qui ne coopèrent pas est un équilibre parfait en sous jeu.
(1) En deuxième étape du jeu, les sujets décident de punir ou pas les autres membres de leur groupe. Soit n2, le nombre de membres dans le groupe et m, le nombre de coopérateurs à l’étape précédente. Vérifions qu’aucun sujet i ne soit incité à dévier à cette étape du jeu. (i) Considérons tout d’abord le cas où le sujet i a dévié à l’étape précédente, c’est à dire s’il n’a pas coopéré. Si le joueur i décide de punir un passager clandestin, il subit alors la désutilité à sanctionner. Or, comme il n’y a pas de différence de gain avec les autres passager clandestin, le joueur i n’est donc pas incité à sanctionner un autre passager clandestin. On vérifie donc que si un sujet dévie de la stratégie d’équilibre en première étape, il dévie également en deuxième étape. (ii) Considérons maintenant le cas où le joueur i n’a pas dévié à l’étape précédente, c’est à dire qu’il a coopéré. S’il ne dévie pas de la stratégie d’équilibre à cette étape et qu’il punit ceux qui ne coopèrent pas, sa fonction d’utilité s’écrit :
Le premier terme de la fonction d’utilité ci-dessus représente l’output moyen que l’agent i reçoit. Le deuxième terme représente le coût pour l'agent i de coopérer. Le troisième terme représente le coût de sanctionner les (n-m) passagers clandestins. Le quatrième terme traduit l'inégalité désavantageuse que l'agent i éprouve vis à vis des passagers clandestins. Cette inégalité s’accroît du fait de l’existence du coût à sanctionner mais est réduite par les sanctions que reçoivent les passagers clandestins.
Considérons maintenant la fonction d’utilité de l’agent i s’il choisit de ne pas punir les passagers clandestins telle que :
Si l’agent i choisit de ne pas punir les autres membres de son groupe, il économise alors le coût cY(n-m) mais ressent plus d’inégalité désavantageuse vis à vis des passagers clandestins, ce qui génère une perte d’utilité de [ (n-m)Y(1-c(n-m))]/(n-1). Il subit par ailleurs de l’inégalité avantageuse vis à vis des (m-1) joueurs qui subissent le coût de sanctionner, ce qui provoque une perte d’utilité de [(n-m) (m-1)cY]/(n-1).La comparaison de (5) et (6) montre qu’un joueur décide de punir un passager clandestin si et seulement si la condition suivante est vérifiée 49 :
Quelques manipulations algébriques montrent que la condition ci-dessus est équivalente à la condition suivante:
(2) En première étape du jeu, les agents décident de coopérer ou non à la production du bien. Supposons que la condition (8) soit vérifiée. Considérons les incitations des agents à ne pas coopérer, c’est à dire à dévier de l’équilibre dans la première étape du jeu. Le gain immédiat obtenu en déviant est f(n-1,n) au lieu de f(n,n)-X. Cependant, s’il dévie, l’agent i sera puni en deuxième étape, ce qui lui procure une perte de (n-1)Y. Les hypothèses (iii) et (iv) impliquent que f(m-1,n)<f(m,n) (l’output s’accroît avec le nombre de coopérateurs) et d’après l’hypothèse (vi) X<(n-1)Y . Les joueurs ne sont donc pas incités à dévier de l’équilibre en première étape du jeu. En deuxième étape, personne ne sanctionne puisque tous coopèrent en première étape. En comparant les modèles avec et sans pression des pairs, il apparaît que l’opportunité de sanction peut faire émerger la coopération car la menace de sanction est crédible, du fait du gain à sanctionner découlant de l’aversion à l’inégalité.
Remarque 1 : Lorsque la condition (8) n’est pas vérifiée, aucun sujet n’est alors incité à sanctionner les passagers clandestins en deuxième étape et personne ne coopère en première étape.
Remarque 2 : Il existe un autre équilibre symétrique parfait en sous jeu où personne ne coopère et personne ne sanctionne puisque cela procure les mêmes gains pour chaque joueur et ne génère donc pas d’inégalité. En effet, lorsque tous les sujets adoptent un comportement de passager clandestin, il n’existe alors pas d’inégalité de gain et donc aucune incitation à sanctionner en deuxième étape du jeu. L’équilibre avec coopération E1 domine au sens de Pareto l’équilibre sans coopération E2. Supposons que le jeu soit répété deux fois et que les issues du premier jeu soient observées avant que le deuxième jeu commence. Alors les joueurs peuvent joueur l’équilibre Pareto dominé comme une menace en cas de non-coopération. L’idée est que les joueurs anticipent différentes issues au deuxième jeu selon les issues du premier jeu (Gibbons, 1992, pp82-88). Si le jeu n’est pas répété, il est difficile à priori de déterminer quel équilibre sera choisi. Cependant, si l’on applique le critère de Pareto dominance sans perfection, E1 sera l’équilibre sélectionné par les joueurs puisque tous le préfèrent (Rasumsen, 1984). Ce raffinement est toutefois arbitraire comme on l’a déjà précisé dans le chapitre précédent puisqu’il suppose que les agents se coordonnent de façon implicite sur l’équilibre pareto dominant.
On retrouve la condition donnée par Fehr et Schmidt (1997), dans leur proposition 5 p19.