2.3.3. Le cas particulier des contingences inter-temporelles

Il existe, enfin, une classe incontournable de circonstances pour lesquelles des préférences changeantes ont pu être constatées. Nous avons ici à l’esprit le domaine particulier des choix inter-temporels. Les ’‘contingences inter-temporelles’’ se distinguent fondamentalement des contingences de procédé, de présentation ou de contexte en ce qu’elles mettent en jeu des préférences relatives à des conséquences étalées dans le temps. De façon typique, il s’agit ainsi pour le décideur de choisir entre deux options, conduisant chacune à la réalisation d’un gain ou d’une perte, d’un plaisir ou d’une souffrance, l’une en t, l’autre en t+n. Les réflexions relatives à la nature de ces arbitrages inter-temporels ont mobilisé, depuis longtemps déjà, philosophes, économistes et psychologues (Ainslie [1975, 1999], Loewenstein [1992]245). Il est généralement admis, comme un constat descriptif bien plus qu’au titre d’une quelconque nécessité normative, que les conséquences futures font l’objet d’une décote systématique.246 Samuelson [1937] a suggéré ce qu’il est convenu d’appeler le ’modèle d’utilité actualisée’ (’discounted utility model’), par lequel il ressort que l’utilité, Ua, attachée à un ensemble de conséquences, c, amenées à se réaliser dans t périodes (ct), peut être appréciée à l’aune de la formule qui suit :

Ua (ct) = [u (c) / µ t]

(U est une fonction d’utilité unique à une transformation linéaire croissante près, donc cardinale. U (c) est l’utilité qui serait attachée à l’ensemble de conséquences c, si celui-ci se réalisait aujourd’hui. Ua est l’’utilité actuelle’ de ct, et µ une constante qui n’est autre que le ’taux d’actualisation’247)

Plus généralement, ce sont les comparaisons entre différents paniers offrant la perspective d’autant de plans de consommation inter-temporels qui se voient parcimonieusement restituées. A l’occasion d’une contribution demeurée classique, Strotz [1955] a montré que les fonctions d’actualisation exponentielles, qui fondent la perspective standard héritée de Samuelson, permettent de garantir la ’cohérence temporelle’ des préférences individuelles. En d’autres termes, l’actualisation exponentielle (de base constante) des conséquences futures assure la stabilité des préférences, de sorte que, sur l’intervalle [t - s, t] on ait partout, soit Ua (ct) > Ua (ct+n), soit Ua (ct+n) > Ua (ct).

L’existence de contingences inter-temporelles apparaît pourtant comme un constat d’expérience commune. Nul n’est d’ailleurs besoin, afin de mettre à jour de telles contingences, de quitter le cadre traditionnel d’un arbitrage inter-temporel, relativement simple, qui ne mettrait essentiellement en jeu que deux ensembles de conséquences. L’illustration paradigmatique de la variabilité inter-temporelle des préférences conduit alors à constater qu’un individu qui, en t-s, affirme préférer l’ensemble ct+n à l’ensemble ct, peut être parfois amené à choisir ct lorsque l’instant t se fait imminent.248 On a ainsi, successivement, sur l’intervalle [t - s, t] : Ua (ct+n) > Ua (ct), puis, Ua (ct) > Ua (ct+n) : à mesure que s’écoule le temps, l’état des préférences vis-à-vis de deux ensembles de conséquences demeurés inchangés en vient à s’inverser.

Strotz [1955] fait allégeance de ces ’incohérences temporelles’, qui met en exergue de son importante contribution quelques lignes tirées d’un épisode fameux de l’Odyssée (cf. aussi Elster [1979]). Plus prosaïquement, de tels revirements de préférence sont le lot commun de nombre d’individus en état de dépendance vis-à-vis de certaines substances, telles le tabac ou l’alcool.249 De même les enfants sont-ils particulièrement sujets à ces revirements de préférence inter-temporels.250 Il ne faudrait pas croire, pour autant, que les incohérences temporelles soient l’apanage de ces publics somme toute particuliers. De façon générale, les contingences inter-temporelles ici évoquées prennent acte de l’ensemble des comportements qui révèlent les limites ou les faiblesses de la volonté individuelle. En ce sens, elles ne manquent pas d’entacher certains arbitrages économiques courants, tels les arbitrages entre épargne et consommation251, ou encore, entre travail et loisir. Ainsi n’est-il pas rare de juger en t-s qu’il serait préférable de travailler ou d’épargner en t afin d’en récolter les fruits démultipliés en t+n, et pourtant d’opter, lorsque se présente l’instant t, pour le plaisir immédiat d’une flânerie ou d’une consommation coupable. Ces contingences semblent donc se distinguer des formes jusqu’ici considérées en ce qu’elles reflètent les limites des aptitudes motivationnelles du décideur non pas tant à recueillir l’information relative à ses préférences qu’à tirer profit de cette information en lui donnant une expression comportementale effective.

Les auteurs comportementalistes ont suggéré, pour l’essentiel, deux classes de modèles afin de rendre compte de la spécificité des problématiques propres aux choix inter-temporels (Loewenstein [1992, pp. 3-4]). Dans la continuité des travaux menés par des psychologues tels R. Herrnstein ou G. Ainslie, certains auteurs se sont notamment efforcés, à l’instar de Loewenstein & Prelec [1992], de spécifier la forme empirique de la fonction d’actualisation. Ces efforts ont conduit à confirmer l’hypothèse psychologique d’une fonction qui serait couramment, non pas exponentielle, mais hyperbolique. La valeur présente d’un ensemble de conséquences amené à se réaliser dans t périodes, semble ainsi devoir être appréciée à l’aune de la fonction suivante :

Ua (ct) = U (c) / (1+µ.t)

(Où µ est une constante à déterminer)

L’actualisation hyperbolique rend compte de taux d’actualisation implicites qui sont une fonction décroissante du délai restant à courir252, et peut donner lieu à des préférences temporelles incohérentes253 (Herrnstein [1961], Ainslie [1975, 1991], Thaler [1981], Ainslie & Haslam [1992]).

Dans le cadre d’une contribution qui se veut expressément le pendant, pour ce qui est des choix inter-temporels, de la contribution de Kahneman & Tversky [1979] à l’analyse des choix en environnement risqué254, Loewenstein & Prelec [1992] s’attachent à rendre compte de divers constats empiriques présentant, au regard du modèle standard, le caractère d’’anomalies’ (cf. Thaler [1981], Loewenstein [1988]). A cette fin, les auteurs mobilisent simultanément les propriétés d’une fonction d’actualisation hyperbolique et d’une fonction de valeur de type Kahneman/Tversky.255 Outre les incohérences temporelles256, la représentation suggérée par Loewenstein et Prelec leur permet ainsi d’expliquer pourquoi il ressort que les taux d’actualisation implicites évoluent, à délai inchangé, en fonction inverse de l’importance des montants en jeu.257 De même les auteurs se trouvent-ils en mesure de rendre compte de ce constat que les taux d’actualisation implicites s’avèrent, toujours à délai inchangé, plus élevés en matière de pertes qu’ils ne le sont en matière de gains.258 Enfin, pour donner une dernière illustration de la fertilité du modèle suggéré par Loewenstein & Prelec [1992], ce modèle permet d’expliquer pourquoi la compensation que réclame un individu afin de recevoir une récompense en t + s, plutôt qu’en t, est très largement (de deux à quatre fois) supérieure au prix que ce même individu est prêt à payer afin de bénéficier de cette récompense en t, plutôt qu’en t + s. 259

La seconde catégorie de modèles comportementalistes des choix inter-temporels, porteuse d’un éclairage davantage complémentaire qu’alternatif, entend mettre l’accent sur le conflit interne qui semble constituer une caractéristique essentielle de ces choix. C’est ainsi que différents auteurs ont suggéré, à l’instar de Shefrin & Thaler260, des ’modèles multi-identitaires’ (’multiple-selves models’). L’actualisation hyperbolique, si elle laisse présager de préférences potentiellement changeantes, néglige en effet l’état de schizophrénie latente que cette perspective est couramment en mesure de provoquer chez l’individu. Celui-ci se voit ainsi comme tiraillé, çà et là, entre une propension (innée ?) à privilégier le plaisir immédiat, et une volonté (raisonnée ?) de prendre acte du manque à gagner qui peut en résulter, à moyen-long terme. Afin de rendre compte de ce qu’il est convenu d’appeler les problématiques du ’self-control’261 (Schelling [1984, 1992]), Shefrin et Thaler présentent, dans une optique freudienne, un modèle dual de la psyché individuelle, dans le cadre duquel un ’planificateur’ (’planner’) s’efforce de garantir, période après période, les intérêts à moyen-long terme de l’individu, face aux aspirations myopes d’un ’exécutant’ (’dooer’).

Cette représentation est en particulier au coeur de l’’hypothèse comportementaliste du cycle de vie’ que suggèrent les auteurs. Le planificateur est ici le garant du comportement d’épargne, s’efforçant de contrôler un exécutant qui serait prêt, non seulement à épuiser le revenu de la période, mais aussi à hypothéquer, au travers d’un recours extensif à l’emprunt, l’ensemble des revenus futurs. Shefrin & Thaler [1988, 1992] font l’hypothèse que le planificateur se trouve en mesure, au prix d’un certain ’effort de volonté’ (’willpower’), de déterminer le comportement d’épargne de l’exécutant.262 Toute la difficulté consiste alors pour le planificateur à mettre en oeuvre des stratégies qui lui permettent de minimiser les coûts psychiques occasionnés par cet usage, récurrent, des vertus de la volonté. Souvent, poursuivent les auteurs, ces stratégies prendront la forme de règles et, en particulier, de règles de ’comptabilité mentale’ que le planificateur impose à l’attention de l’exécutant. Loin de respecter le principe standard de fongibilité263, les agents -le planificateur comme l’exécutant- procéderaient ainsi à un cloisonnement mental de leur richesse, les conduisant à distinguer ce qui relève du revenu courant, d’une part, du patrimoine courant, d’autre part, et du revenu futur, enfin. Ce cloisonnement s’accompagnerait alors de règles qui consacreraient la légitimité relative du revenu courant comme support des comportements de consommation, jetant, a contrario, l’anathème sur la consommation dès lors qu’elle grèverait les revenus futurs. Sans échapper à une lecture fonctionnaliste, les auteurs font implicitement l’hypothèse que l’exécutant intériorise ces diverses règles de comptabilité mentale. On en vient de la sorte à établir un point crucial de la représentation comportementaliste du cycle de vie, à savoir l’hypothèse d’une propension marginale à consommer qui serait à géométrie variable -la propension la plus forte se manifestant dans le domaine du revenu courant, la plus faible dans celui du revenu futur264. De par le jeu des règles de comptabilité mentale, le planificateur se voit en mesure d’assurer le volume d’épargne requis au prix d’un effort de volonté restreint.

Notes
245.

L’auteur passe en revue les apports déterminants d’économistes des XIXème et XXème siècles tels Rae, Senior, Jevons, Böhm-Bawerk, Fisher, Samuelson ou Strotz.

246.

Sur un plan normatif, l’incertitude inhérente au futur semble constituer le seul facteur qui soit généralement perçu comme susceptible de donner un fondement ’rationnel’ à la préférence pour le présent (ou, plus généralement, à la ’préférence pour la proximité temporelle’ des expériences plaisantes). A l’occasion d’une contribution tout à fait fondamentale, Ainslie [1975, pp. 464-5] suggère une classification ternaire des diverses réflexions qui, de l’économie à la psychologie, en passant par la philosophie ou la psychosociologie, s’efforcent d’expliquer la prévalence de la préférence pour le présent, en tant que constat descriptif. Selon l’auteur, trois interprétations (ou, plutôt, trois intuitions) distinctes se dégageraient de ces réflexions, la préférence pour le présent étant conçue soit : 1) comme le résultat d’une connaissance imparfaite qui conduit le décideur à délaisser, à son insu, la perspective d’une satisfaction ultérieure, mais supérieure ; soit 2) comme le produit d’un arbitrage en pleine connaissance de cause qui serait néanmoins orienté par une ’force irrésistible’, telle une pulsion ou une habitude ; soit enfin 3) comme la conséquence d’un mécanisme inné qui conduirait le décideur -là aussi en pleine connaissance de cause- à grever d’une décote toute conséquence qui ne serait pas immédiate.

247.

Fisher, le premier, a montré qu’en présence de marchés de capitaux efficients, les agents devraient (à la marge) actualiser les flux monétaires sur la base du taux d’intérêt (après impôts) en vigueur. C’est là le corollaire direct de l’épuisement des possibilités d’arbitrages inter-temporels (cf. Loewenstein & Thaler [1989]).

248.

Dans un propos qui certes frise la ’robinsonnade’, Thaler [1981] illustre simplement ce point : aucun individu n’opterait, selon toute vraisemblance, pour une option offrant une pomme dans un an au détriment d’une option en offrant deux dans un an et un jour ; pourtant, il se trouverait certainement des individus pour privilégier l’option offrant une pomme aujourd’hui, à l’option offrant deux pommes demain.

249.

Il est possible d’adopter deux stratégies distinctes afin de restituer les problématiques de l’accoutumance dans le cadre d’un arbitrage inter-temporel qui porterait sur deux ensembles de conséquences : ct et ct+n. On peut, d’abord, appréhender chaque expérience de tentation comme constituant un arbitrage en soi : il s’agit, pour l’individu, d’arbitrer entre le plaisir associé à l’usage de la substance dont on est dépendant, d’une part, et le plaisir qui résulte du simple fait d’avoir résisté à la tentation, d’autre part. Mais on peut aussi ’globaliser’ ces diverses expériences, de sorte que l’arbitrage inter-temporel mette en jeu, d’une part, l’ensemble des plaisirs de court terme associés à l’usage de la substance dont on cherche à éviter l’emprise et, d’autre part, l’ensemble des bienfaits qui résultent d’une abstinence a priori définitive.

250.

Les travaux du psychosociologue W. Mischel sont ici la référence (cf. Mischel et al. [1992] pour une synthèse panoramique).

251.

Ces arbitrages sont précisément au coeur de la contribution de Strotz [1955].

252.

C’est là, en fait, la marque d’une impatience qui va croissante à mesure que s’approchent les conséquences (positives) attendues.

253.

Rappelons que l’approche standard fait l’hypothèse d’une actualisation à taux constant. Cette hypothèse garantit que le rapport Ua (ct) / Ua (ct+n) restera inchangé sur l’intervalle [t-s, t], de sorte que la cohérence temporelle se voit effectivement assurée.

254.

Ce rapprochement paraît d’autant plus légitime qu’à l’instar de l’éloignement temporel, la présence de risque (ou, plus généralement, d’incertitude) conduit le décideur à frapper les conséquences qu’il envisage d’une décote systématique.

255.

Pour l’essentiel, les auteurs restreignent leurs propos aux choix inter-temporels relatifs à des enjeux monétaires. Les conséquences non-monétaires semblent introduire des considérations plus subtiles (et apparemment plus paradoxales) encore, tels le rôle du ’plaisir par anticipation’ ou, au contraire, de la ’souffrance par anticipation’, qui conduit l’individu, ici, à privilégier l’occurrence immédiate d’une expérience déplaisante, là, à reporter un évènement plaisant. De tels phénomènes laissent apparaître des taux d’actualisation négatifs ! (cf. Loewenstein & Thaler [1989]).

256.

Les auteurs placent ces incohérences sous l’intitulé ’common difference effect’.

257.

Ce constat, que les auteurs désignent sous l’intitulé ’absolute magnitude effect’, s’explique aisément au regard de la propriété de ’sensibilité décroissante’ de la fonction de valeur de Kahneman/Tversky. Sous certaines conditions, la théorie standard peut prédire l’effet en question pour la seule classe des montants négatifs (mais elle prédit, dans le même élan, l’effet inverse pour ce qui est des résultats positifs !).

258.

Ce constat, que les auteurs placent sous l’intitulé ’gain-loss asymetry’, s’explique quant à lui sur la base de la propriété d’’aversion pour les pertes’ de la fonction de valeur de Kahneman/Tversky. Il est à noter que la représentation standard -du fait de la concavité de la fonction d’utilité- prédit également une telle asymétrie. Elle suggère néanmoins, dans le même élan, que cette asymétrie est d’autant plus faible que les montants en jeu sont eux mêmes faibles. C’est précisément l’inverse que l’on constate, et ce dont le modèle de Loewenstein & Prelec [1992] est en mesure de rendre compte (cf. note précédente).

259.

Cette ’anomalie’ constitue ce que les auteurs qualifient de ’delay-speedup asymmetery’, et résulte de la propriété d’aversion pour les pertes ainsi que de la spécificité du transcodage des conséquences tout naturellement retenu par la plupart des individus (i. e. le délai supplémentaire est évalué comme une perte, alors que la perspective d’une réduction de ce délai est appréhendée comme un gain potentiel).

260.

Cf. Thaler & Shefrin [1981], Shefrin & Thaler [1988, 1992].

261.

L’on trouve au coeur de ces problématiques une présentation, à vocation descriptive ou prescriptive, des ’stratégies’ auxquelles l’individu peut recourir afin de s’assurer que l’option conduisant à l’ensemble de conséquences longtemps le moins valorisé, mais le plus immédiat, ne soit pas finalement retenue. La classification (générale) suggérée par Ainslie [1975, p. 474] nous paraît, aujourd’hui encore, des plus satisfaisante. Selon l’auteur, l’individu peut ainsi s’assurer : a) que le revirement de préférence prévisible n’aura pas lieu ; b) qu’il ne sera pas possible, lorsque le revirement escompté se produira, de déroger aux dispositions prises sur la base des préférences antérieures ; c) que les stimuli susceptibles de déclencher le revirement de préférence ne soient pas perçus. Le point a) renvoie aux stratégies qui conduisent à altérer les préférences de l’individu. A un niveau très général, la socialisation entraîne précisément des évolutions favorables à un meilleur ’contrôle de soi-même’ (cf. les réflexions de Shefrin & Thaler relatives à la ’comptabilité mentale’, rapportées plus haut, § 1.3.2. & 1.4.3.) ; de façon plus anecdotique, un individu peut ’miser’ une certaine somme, ou encore sa réputation ou son honneur, sur son aptitude à ne pas céder à la tentation, un alcoolique peut recourir à des substances qui produisent des nausées au contact de boissons alcoolisées... Le point b) repose sur la mise en place de dispositifs physiques ou contractuels qui rendent inaccessible l’option à court terme (dispositifs que Strotz [1955] évoque sous l’intitulé ’pre-commitment’). Ainsi Ulysse se fait-il solidement attacher au mât, ou tel individu laissera ses clés de voiture à un proche pour éviter de conduire en état d’ivresse. De même existe-t-il diverses formes d’épargnes (quasi)obligatoires. Le point c), enfin, renvoie aux ’stratégies d’évitement’ qui conduisent à se tenir à l’abri des stimuli source de tentation. Il s’agira, ici, d’éviter tel ou tel magasin, là de ne pas s’acheter de télévision...

262.

Formellement, les auteurs suggèrent que la fonction d’utilité de l’exécutant est une fonction croissante du niveau de consommation retenu, mais une fonction décroissante du niveau d’’effort de volonté’ déployé par le planificateur (l’exercice du ’willpower’ induirait, en effet, un certain sentiment -déplaisant- de culpabilité chez l’exécutant).

263.

Principe selon lequel il ressort que ’la monnaie est affectée à sa finalité la plus valorisée’, puisque ’la monnaie est indifférenciée’ (Thaler [1987, p. 111]).

264.

Afin d’asseoir la pertinence empirique de cette hypothèse et, par la même occasion, des règles de comptabilité mentale rapportées ci-dessus, Shefrin et Thaler ont eu recours à des questionnaires invitant les individus interrogés à se prononcer sur l’éventuel surplus de consommation personnelle qui résulterait s’ils bénéficiaient : 1) d’un bonus versé mensuellement (assimilé, selon toute vraisemblance, à un revenu courant), 2) d’un bonus -équivalent- versé en fin d’année (plus aisément assimilable au patrimoine courant), 3) d’un héritage -toujours d’un même montant- à recevoir (avec certitude) dans quelques années (clairement, un revenu futur). Les montant rapportés vont nettement par ordre décroissant, suggérant ainsi tant les limites du principe de fongibilité, que le caractère différencié des propensions marginales à consommer.