1.3.1. Heuristiques et biais : les jugements par ’représentativité’

La procédure heuristique de loin la plus étudiée met en jeu l’idée d’un jugement par ’représentativité’. Cette modalité d’appréciation semble tout particulièrement susceptible d’être déployée lorsqu’il s’agit d’estimer la probabilité qu’un objet B appartienne à une catégorie A et/ou qu’un événement B résulte d’un processus A (Kahneman & Tversky [1972]). Dans un cas comme dans l’autre, suggèrent Kahneman et Tversky, le décideur aura tendance à juger les perspectives en question d’autant plus vraisemblables que B lui paraît ’représentatif’ de A ou, en d’autres termes, que B ’ressemble’ à A.301 Ainsi que le reconnaissent aisément les auteurs (Kahneman & Tversky [1972]), une telle suggestion ne peut être saisie que de façon somme toute intuitive. C’est au demeurant pourquoi ils s’attachent, dans une large mesure, à illustrer plutôt qu’à définir le jugement par représentativité.

S’agissant d’illustrer la pertinence de leur propos au regard du premier domaine d’application identifié plus haut (soit les relations d’appartenance), Kahneman & Tversky [1973] rapportent en particulier une série d’expériences dans le cadre desquelles le sujet se voit présenter, d’une part, un profil psychologique prétendument établi par un spécialiste et, d’autre part, une liste de professions ou de cursus universitaires. La tâche expérimentale consiste alors, pour le sujet, à se prononcer sur la profession effectivement exercée ou le cursus effectivement suivi par l’individu ainsi décrit en s’efforçant de classer, par ordre décroissant de vraisemblance ou de probabilité, les professions ou les cursus soumis à son attention.302 Les auteurs font ici l’hypothèse que la démarche communément retenue conduira le sujet à apprécier le degré de similitude qui unit la description psychologique examinée au stéréotype qu’il associe à chacune des professions ou à chacun des cursus possibles. Une profession ou un cursus est en ce sens jugé d’autant plus probable que le profil psychologique considéré la/le représente bien. De fait, les auteurs constatent des résultats peu ou prou similaires, qu’ils demandent expressément à un groupe d’ordonner les professions ou les cursus par ordre décroissant de représentativité (des professions ou cursus qui semblent les mieux ’représentés’ -’stéréotypés’- par tel ou tel profil psychologique à celles ou ceux qui semblent l’être le moins bien), ou qu’ils invitent un autre groupe à les ranger par ordre décroissant de probabilité ou de vraisemblance.

Quant au second domaine d’application privilégié que soulignent les auteurs (soit les relations d’engendrement), on peut en particulier rappeler, à leur suite, que la plupart des individus jugeront plus probable, au terme d’une séance de lancés à pile ou face, d’obtenir la séquence P-F-P-F-F-P que les séquences P-P-P-F-F-F ou P-P-P-P-F-P. La première séquence a en effet le mérite évident : 1) de préserver -contrairement à la seconde- le caractère aléatoire du processus tel que le perçoivent la plupart des individus (de préserver une relative alternance), 2) de préserver -contrairement à la troisième- l’équilibre global du processus (de conduire, ainsi, à un nombre approximativement équivalent de piles et de faces). Bien que ces différentes séquences soient tout aussi (im)probables, la séquence P-F-P-F-F-P paraît donc, dans l’ensemble, plus représentative du processus aléatoire d’engendrement et, partant, plus probable. On en vient tout naturellement à aborder les différents biais que les jugements par représentativité sont susceptibles d’occasionner.

En même temps que la série d’expériences rapportée ci-dessus permet à Kahneman et Tversky d’illustrer la pertinence de leur propos, elle conduit les auteurs à révéler l’existence d’un biais, des plus répandus, qui voit le décideur négliger systématiquement les probabilités a priori (’base-rates’). Ainsi, les sujets invités à inférer l’orientation universitaire probable d’un individu suggèrent des réponses qui font fi des fréquences empiriques de répartition des étudiants entre les diverses filières. Alors qu’ils ont connaissance (a priori) de la faiblesse relative des effectifs engagés, à titre d’exemple, en sciences de l’information, une très large majorité de sujets n’hésitera pas, au vu d’un profil psychologique donné, à considérer (a posteriori) que tel étudiant a davantage de chances d’être engagé dans cette filière plutôt que dans telle autre qui, pourtant, draine un nombre autrement plus important d’étudiants. En vertu de la règle de Bayes, une sous-pondération aussi nette de l’information a priori ne peut paraître justifiée que si l’information nouvellement acquise constitue une source de prédiction essentiellement fiable. Or, au dire même des sujets, les profils psychologiques ne sauraient constituer que des indicateurs somme toute bien fragiles. Dans la mesure, cependant, où les jugements procèdent intuitivement (et irrésistiblement) par représentativité, ces indicateurs en viennent à jouer un rôle disproportionné.

La croyance en ce que Kahneman & Tversky ont appelé ’la loi des petits nombres’303 constitue un second biais, tout aussi répandu et important que le précédent. Juger de la représentativité d’un échantillon, semble devoir conduire le décideur à s’interroger, d’une part, sur le degré de ressemblance entre l’échantillon et la population-mère304 et, d’autre part, sur le caractère plus ou moins aléatoire de la séquence obtenue305 (cf. l’exemple du lancé à pile ou face, rapporté plus haut). Si telle est bien l’essence du jugement par représentativité en matière d’échantillonnage, et pour autant qu’une telle procédure heuristique soit effectivement déployée, il doit en résulter une insensibilité du jugement prédictif à la taille de l’échantillon ou, en d’autres termes, une tendance à émettre des jugements approximativement identiques que l’on ait affaire à un échantillon de taille restreinte ou à un très large échantillon. Aussi, c’est pourquoi Kahneman et Tversky en viennent à attribuer aux jugements par représentativité l’erreur qui consiste à étendre les vertus de la loi des grands nombres à des échantillons de petite taille.

Une illustration, parmi bien d’autres, de l’impact de la ’loi des petits nombres’ tient dans la teneur des réponses apportées au problème suivant : soit une ville dotée de deux maternités ; il naît en moyenne 45 bébés par jour dans la plus grande de ces maternités, contre 15 dans la plus petite ; durant une année, chaque maternité a répertorié le nombre de jours pour lesquels plus de 60 % des enfants nés étaient des garçons ; pour quelle maternité ce chiffre est-il susceptible d’être le plus élevé ? La majorité des sujets interrogés indiquent que les deux maternités ont dû répertorier sensiblement le même nombre de jours. Guère plus d’un sujet sur cinq est en mesure de fournir la bonne réponse, à savoir que la plus petite maternité est vraisemblablement celle qui a enregistré le plus de jours marqués par une proportion élevée de naissances masculines. Ainsi que le signalent Kahneman & Tversky [1972, p. 45] : ’‘The notion that sampling variance decreases in proportion to sample size is apparently not part of man’s repertoire of intuitions’’. La loi des petits nombres est également à l’oeuvre dans cette intuition irrésistible que l’on qualifie communément de ’sophisme du joueur’ (’gambler’s fallacy’) : après avoir observé une série de ’piles’ ou, après avoir vu le rouge sortir trois ou quatre fois consécutivement, bien des joueurs estiment que ’face’ doit se produire, ou que la couleur noire doit sortir. C’est là, bien sûr, une méconnaissance totale de la logique des ’tirages avec remise’ qui peut être assimilée à une croyance en la validité locale de la loi des grands nombres.

Quelques autres biais possiblement liés à la prégnance des jugements par représentativité ont été identifiés par Kahneman et Tversky. Brièvement, les auteurs font notamment état des difficultés que rencontrent la plupart des individus à nuancer leurs appréciations au vu de la fiabilité ou de la pertinence prédictive des sources sur lesquelles celles-ci se fondent. Déjà signalées plus haut (cf. l’exemple des ’profils psychologiques fictifs’306), ces difficultés se trouvent également à l’origine de ce que les auteurs appellent l’’illusion de validité’. Le phénomène résulte de ce constat que la représentativité d’un ensemble d’informations (un profil psychologique ou un score à un test particulier, par exemple) par rapport à un certain résultat (un cursus universitaire ou un niveau général d’aptitude, par exemple) semble largement influencée par la quantité d’informations ou d’indices disponible. Lorsque ces informations ou ces indices sont corrélés et, partant, redondants, recourir à l’heuristique de représentativité peut donc induire une illusion de validité. En effet, le décideur aura tendance, dans ces conditions, à accorder une probabilité trop forte à tel ou tel résultat et/ou à témoigner d’un degré de confiance excessif en la pertinence de ses appréciations.307

La corrélation entre ’degré de représentativité’ et ’degré de probabilité’ apparaît plus défaillante encore lorsqu’on en vient à examiner le biais que Kahneman et Tversky placent sous l’intitulé ’sophisme de conjonction’ (’conjunctive fallacy’). C’est un principe élémentaire que la probabilité associée à la réalisation simultanée de deux événements (ou plus) ne peut être supérieure à la probabilité que l’un quelconque de ces événements en particulier se réalise ; on doit avoir ainsi (pour deux événements) : p (A ∩ B) < p (A) et p (A ∩ B) < p (B). Les jugements par représentativité peuvent néanmoins conduire à des violations systématiques de ce principe établi. Toujours dans le cadre d’expériences mettant en jeu des profils psychologiques fictifs, Kahneman et Tversky ont ainsi pu constater que 80% à 90% des sujets sollicités sont en proie aux sophismes de conjonction, estimant ici plus probable que tel individu soit ’comptable’ et ’passionné de jazz’ plutôt que ’passionné de jazz’ (sans autres précisions), là que tel autre soit ’banquier’ et ’féministe’ plutôt que ’féministe’ (sans autres précisions). A l’évidence, la conjonction de plusieurs traits descriptifs peut apparaître plus ’représentative’ (d’un profil psychologique donné) que ne l’est tel ou tel trait pris isolément.

Notes
301.

A l’occasion d’une contribution ultérieure (Tversky & Kahneman [1982]), les auteurs se sont efforcés d’étendre, ainsi que de rationaliser, leur approche des jugements de ’représentativité’. La représentativité se voit, dans le cadre de cette contribution, dépeinte comme une relation unissant un processus ou un modèle A à une catégorie ou un événement B qui leur serait associé. A peut être : 1) une distribution (au sens statistique du terme), 2) une catégorie ou une classe d’objets, 3) une population (là aussi, au sens statistique du terme), ou 4) une cause ou un système de causalités. B serait alors, respectivement : 1) une valeur numérique synthétique (telle une moyenne ou une médiane), 2) un élément particulier appartenant à telle catégorie ou telle classe, 3) un échantillon, 4) un effet ou un ensemble d’effets. Nous focalisons donc ici notre présentation -à l’instar des auteurs- sur les jugements par représentativité en tant qu’ils relèvent des catégories 2 & 3.

302.

A titre d’exemple, Kahneman & Tversky [1973, p. 49] rapportent la description qui suit de Tom W. : ’ Tom W. is of high intelligence, although lacking in true creativity. He has a need for order and clarity (...) He seems to have little feel and little sympathy for other people (...) Self-centered he nonetheless has a deep moral sense (...)’. Sur la base de cette seule description, le sujet est alors invité, ici, à établir une prédiction probabiliste relativement au cursus universitaire choisi par l’intéressé.

303.

Cf. Tversky & Kahneman [1971], Kahneman & Tversky [1972].

304.

Les différentes composantes sont-elles représentées ? Les proportions sont-elles conservées ?

305.

A supposer, donc, que l’’ordre de tirage’ soit observé.

306.

Kahneman & Tversky donnent cette autre illustration : amenés à anticiper le classement de fin d’année d’un étudiant donné, sur la base d’une note obtenue en tout début de cursus, un grand nombre de sujets suggèrent des réponses qui laissent entendre que celle-ci préfigurerait parfaitement celui-là. Bien que tel ou tel résultat puisse être ’représentatif’ de la catégorie des bons ou des mauvais élèves, la logique statistique voudrait, néanmoins, qu’un jugement prédictif fondé sur une source aussi précaire soit systématiquement corrigé vers la moyenne (il conviendrait donc, ici, d’anticiper un classement moins extrême : plus proche du milieu de la promotion).

307.

Cf. ci-dessus, § 1.2.2.