c. Les limites méthodologiques et techniques de la théorie économique du choix rationnel

Pour Arrow (1999, pp. 167-168), les origines de la conceptualisation du principe de rationalité en économie seraient les suivantes :

‘Gossen, Jevons, Walras, Menger, et Edgeworth ont introduit l’hypothèse selon laquelle le choix de consommation d’un panier de biens est déterminé par la maximisation de la fonction d’utilité sous contrainte budgétaire. Irving Fisher et Vilfredo Pareto ont observé que la nature cardinale de la fonction d’utilité était non pertinente ; seul un classement des paniers de biens devait être postulé. Samuelson (1938) a introduit un changement d’orientation avec le concept de préférences révélées. Les choix effectués, et non un classement sous-jacent ou une fonction d’utilité, étaient primordiaux. Les conditions de la rationalité ont été imposées sur les choix. (Arrow, 1999, p. 167, nous soulignons)’

Il ajoute que la réflexion sur le choix social a fourni une stimulation nouvelle pour l’étude du choix individuel et la signification de rationalité. Il est en effet apparu certaines failles dans la manière dont la théorie économique conçoit le comportement rationnel et les écrits de Sen sont très éclairants sur ce sujet. Dans le New Palgrave, Sen (1987g, p. 68) propose une définition du « comportement rationnel » 279 et justifie l’intérêt pour ce concept par deux motivations : (1) la motivation « prescriptive » et (2) la motivation « explicative » ou « prédictive ». D’une part, dans la mesure où les exercices économiques ont souvent une forme prescriptive, il est intéressant de savoir comment on peut — et doit — se comporter rationnellement dans une situation donnée 280 . D’autre part, il y a un grand intérêt à caractériser le comportement rationnel effectif afin, généralement, de pouvoir prédire l’effet des politiques.

Sen note dans un premier temps que l’on peut distinguer deux conditions particulières qui impliquent un changement dans l’analyse du comportement individuel : un environnement certain, ou la présence d’incertitudes. En situation d’incertitude, le comportement rationnel nécessite une appréciation des variations possibles dans le résultat d’une action choisie. Partant, un tel comportement doit être basé sur une lecture systématique des incertitudes concernant les résultats et les manières de les obtenir. En fait, le comportement en situation de certitude peut formellement être considéré comme un cas particulier — et extrême — du comportement en situation d’incertitude 281 .

Bien qu’il y ait différentes approches du comportement rationnel en situation de certitude, Sen (1977d, 1987g) en a identifié deux principales : celle où la rationalité coïncide avec la cohérence interne des choix — assimilés aux préférences —, et celle où la rationalité correspond à la poursuite de son intérêt propre. La première se traduit formellement par la maximisation d’un classement de préférences, sous la forme de relations binaires, satisfaisant à la fois la complétude et la transitivité. On retrouve alors la définition retenue par Arrow (1951). La seconde approche serait un cas particulier de la première, puisque la maximisation de l’intérêt individuel égoïste aboutit à un classement de préférences cohérent 282 .

Sen note toutefois que la cohérence interne des choix peut être considérée comme une condition nécessaire, mais non suffisante de la poursuite de son propre intérêt. Pourtant, les économistes — et leur sens de la « plausibilité » 283  — ont tendance à considérer que « si vous êtes cohérent, peu importe que vous soyez un égoïste obstiné, un altruiste fou ou un militant doté d’une conscience de classe, vous paraîtrez, dans ce monde enchanté des définitions, maximiser votre propre utilité » (Sen, 1993a, p. 93).

Ce qui est certain, c’est que le comportement rationnel considéré comme la maximisation dans la poursuite de son intérêt propre rend l’analyse du comportement individuel bien plus aisée que ne le ferait une hypothèse moins structurée. Ceci constitue l’un de ses plus grands attraits (Sen, 1987g, p. 69). En outre, cette hypothèse est également cruciale pour déduire les résultats qui sont au cœur de la théorie économique moderne et traditionnelle. Sen fait référence ici à l’optimalité parétienne de chaque équilibre concurrentiel et à sa réciproque sous certaines conditions, qui constituent les deux « théorèmes fondamentaux de l’économie du bien-être ». En effet, cette correspondance entre l’optimum de Pareto et l’équilibre concurrentiel ne fonctionne que sous certaines hypothèses, comme l’absence d’externalités, mais surtout un comportement individuel « intéressé ». Cela vient du fait que l’optimalité parétienne est une caractéristique de la maximisation des intérêts individuels dans un groupe, puisque dans une telle situation, aucun intérêt individuel ne peut être augmenté sans diminuer celui de quelqu’un d’autre.

Dans certaines théories cependant, la distance entre les deux approches de la rationalité — la cohérence interne des choix et « l’égoïsme par définition » (Sen, 1993, p. 94) — disparaît. C’est notamment le cas dans la « théorie des préférences révélées », dont le pionnier fut Samuelson (1938). Cette théorie, en considérant que dans chaque acte de choix isolé, quoi qu’une personne fasse, elle poursuit ses propres intérêts, est selon Sen particulièrement infondée et il s’est attaché à la critiquer à de multiples reprises (Sen, 1971, 1973b, 1977d). L’extrait suivant montre comment Sen perçoit cette théorie :

‘La réduction de l’homme à un animal préoccupé de ses seuls intérêts dépend, dans cette analyse, d’une définition précise. Si l’on observe que vous choisissez x en rejetant y, on déclare que vous avez une préférence « révélée » pour x au détriment de y. Votre utilité personnelle est alors définie simplement comme une représentation numérique de cette « préférence », une utilité plus élevée étant affectée à l’option « préférée ». Avec cet ensemble de définitions, il est difficile d’échapper à la maximisation de sa propre utilité, à moins de se montrer incohérent. Bien entendu, si une fois vous choisissez x et rejetez y, puis si vous vous empressez de faire exactement le contraire, vous pouvez empêcher le théoricien d’effectuer un classement des préférences, ce qui lui interdit de vous apposer une fonction d’utilité que vous devriez maximiser. Il devra alors conclure soit que vous êtes incohérent, soit que vos préférences varient. (Sen, 1993, p. 93)’

Le premier article de Sen traitant précisément de la théorie des préférences révélées est « Choice Functions and Revealed Preferences » (1971) 284 . Il est important de préciser que, dans celui-ci, Sen ne dépasse pas la critique logique de cette théorie, c’est-à-dire qu’il n’entre pas encore dans les questions empiriques ou normatives. En effet, il cherche seulement à mettre en évidence deux limites techniques importantes. Dans un premier temps, il montre que la théorie traditionnelle des préférences révélées concerne presque exclusivement des relations de préférence « transitives ». Ainsi, la cohérence du choix qu’elle exige est d’une forme particulièrement exacte qui rend les choix représentables par une relation binaire transitive. Cependant, Sen considère qu’il y a de bonnes raisons d’attendre d’une relation de préférence « introspective » ou observée qu’elle ne soit pas complètement transitive 285 . Et il rappelle à ce sujet que le besoin d’admettre l’intransitivité de l’indifférence a été démontré avec force dans plusieurs contextes, notamment dans le cadre de la théorie de la demande.

Dans un deuxième temps, il met en évidence une seconde limite de la théorie des préférences révélées : la restriction selon laquelle la cohérence du choix est exigée seulement pour une classe de polyèdres convexes (les « triangles budgétaires » dans un cas à deux biens). Si c’est la forme avec laquelle les choix effectifs sont faits par les consommateurs sur les marchés concurrentiels, la forme peut être bien différente dans des situations de marché non concurrentiel, et dans les choix autres que ceux qui concernent la pure consommation — par exemple, ceux des votants ou des bureaucraties gouvernementales.

Enfin, Sen identifie une question plus profondément méthodologique dans l’utilisation d’axiomes de cohérence pour les choix concernant les ensembles budgétaires uniquement. Puisqu’il s’agit d’un axiome — et non d’une hypothèse soumise au test empirique —, pourquoi doit-il s’appliquer uniquement aux choix qui peuvent être observés (dans ce cas, les comportements individuels sur les marchés), plutôt que, de manière générale, aux choix qui peuvent survenir ? Il considère ainsi qu’il serait utile de factoriser 286 les exigences pour des conditions diverses de régularité des préférences. En effet, si l’exigence de cohérence n’est plus exclusivement confinée aux ensembles budgétaires de choix, la structure de la théorie des préférences révélées change largement par rapport à son format traditionnel. Et Sen (1971) présente ses tentatives de factorisation.

De ces diverses manières, cet article de 1971 se passe du besoin de recherches empiriques ou normatives concernant le fondement des axiomes utilisés. Or, étant donné que Sen critiquera peu de temps après, et de manière virulente, l’axiome de préférence révélée 287 , on peut se demander quelle pertinence peut encore avoir son article. Il a lui-même apporté sa réponse dans l’introduction de Choice, Welfare and Measurement (Sen, 1982, p. 5) :

‘[I]l vaut la peine de mentionner que les résultats techniques de [« Choice Function and Revealed Preferences »] — ainsi que les contributions d’autres auteurs dans le même cadre — ne sont pas tous perdus lorsque l’on donne à la préférence une existence propre comme concept introspectif. Les résultats ont ensuite besoin d’être interprétés soit comme (1) traitant exclusivement de relations de choix binaires ce qui ne coïncide pas nécessairement avec la notion introspective de « préférence », soit comme (2) traitant de la notion introspective de préférence sous des hypothèses empiriques ou normatives garantissant un choix « préférentiel ».’
Notes
279.

 On peut se demander pourquoi Sen a choisi le concept de « comportement rationnel », et non celui de « choix rationnel » (il n’y a d’ailleurs aucune entrée dans le New Palgrave pour « choix rationnel »). L’idée de choix est bien sûr évoquée, mais dans un sens plutôt mécanique. Cette question nous renvoie à une thèse développée par Hannah Arendt (1983, p. 80) selon laquelle la science moderne de l’économie, science sociale par excellence, n’a pu se développer que parce que « le comportement a remplacé l’action comme mode primordiale des relations humaines ». Pour la philosophe, l’économie est d’ailleurs « la science du comportement ». L’idée d’ « action » renvoie à celle de « choix », alors que l’idée de « comportement » renvoie à celle de conformisme, de norme de conduite, réduisant l’homme à « un animal conditionné à un comportement prévisible ».

280.

 Notons que, de manière surprenante, Sen (1987g, p. 68) signale que la prescription n’est pas nécessairement d’un type éthique : « la motivation prescriptive est parfois décrite en des termes clairement non-éthiques, comme la poursuite de son intérêt personnel uniquement ». Sen semble ici confondre le terme scientifique d’éthique qui peut tout à fait correspondre à une éthique de l’intérêt personnel, et le sens courant qui aurait plutôt un sens moralisateur et contiendrait l’idée d’altruisme.

281.

 Nous ne développerons pas ici la théorie du choix rationnel en situation d’incertitude. Précisons simplement que le passage de la modélisation du comportement rationnel d’une situation de certitude à une situation d’incertitude consiste généralement dans le passage de la théorie de l’utilité ordinale à la théorie de l’utilité espérée (Sen, 1987, p. 72).

282.

 Précisons qu’il est important de distinguer l’hypothèse de maximisation du bien-être individuel comme une condition de la rationalité, ou comme une hypothèse empirique quant au comportement effectif des gens (Sen, 1982, p. 6). Les deux utilisations peuvent être rencontrées dans la théorie économique traditionnelle. Et, si les deux sont critiquables, elles ne le sont pas sur les mêmes bases. Sen (1973b) critique l’hypothèse empirique, alors que dans « Rational Fools » (1977d), il s’attaque aux deux fronts — hypothèse à tester et condition de la rationalité. Nous reviendrons sur ces points un peu plus loin.

283.

 En effet, en économie, il est assez habituel de compléter l’exigence de cohérence avec certaines conceptions quant à ce que l’individu maximiserait. Or, la régularité de la poursuite cohérente de l’intérêt personnel est une hypothèse implicite de comportement rationnel fréquemment utilisée. Seuls quelques auteurs — Edgeworth (1881) par exemple — ont discuté le bien fondé de cette hypothèse explicitement. (Sen, 1982, p. 5)

284.

 Selon Arrow (1999, p. 168), cet article de Sen est un résumé et une extension de toutes les études faites à ce sujet, par les théoriciens du bien-être, dont Arrow lui-même.

285.

 Sen (1971) distingue trois cas, impliquant une régularité croissante : (1) la fonction de choix (nous disant ce qui est choisi dans chaque sous-ensemble) est représentable par une relation de préférence binaire (appelée « normalité », mais « binarité » serait une description plus directe), (2) la relation de préférence est en plus quasi-transitive (une préférence transitive stricte, et pas nécessairement une indifférence transitive), et (3) la relation de préférence est en plus complètement transitive. Les exigences de cohérence pour chaque cas sont présentées de manière axiomatique.

286.

 « Factoriser » revient à transformer une somme de termes en un produit de facteurs.

287.

 Par exemple, il dira plus tard, dans le cadre des Royer Lectures qui se sont tenues à Berkeley en 1986, « quelles que soient les conditions de la cohérence, il est difficile de croire que la cohérence interne des choix puisse être une condition suffisante de la rationalité » (Sen, 1993, p. 16).