1.2 L’évolution du concept de causalité: D’Aristote à Mackie

La pensée conceptuelle et l’approche de la causalité qui se fait au travers du raisonnement du chercheur ou du philosophe évolue et change avec les époques. En effet, nous pouvons dire que le terrain causal (circonstances) d’émergence d’une pensée scientifique donnée dépend non seulement du raisonnement de la personne mais aussi de l’espace-temps dans lequel elle a été créée. L’approche de la causalité a évolué en même temps que le développement social, artistique et scientifique du monde. Le philosophe analyse le monde selon son propre raisonnement qui découle de ses observations.

Aristote (env -300 avant JC) est certainement le premier philosophe à s’être penché non seulement sur la causalité déterminée par les lois de la nature mais aussi sur le raisonnement causal de l’individu. Son raisonnement et sa démarche philosophique sont toujours utilisés par les chercheurs et les scientifiques qui restent influencés par son discours. Pour Aristote, la logique est l’instrument du savoir (ornagon), mais elle n’est pas elle-même un savoir. En effet, lorsque la logique est formelle, elle permet d’élaborer la théorie des propositions, des jugements, des raisonnements fondés sur la dénomination et le syllogisme. C’est une théorie de la connaissance qui s’enracine dans la perception et qui est soumise à l’expérience, la mémoire. Ainsi, grâce à l’induction et à la déduction, la logique devient une proposition de raisonnement universelle et générale. L’oeuvre d’Aristote est une tentative d’organisation de la totalité du savoir qui contrairement à Platon ne se réfère pas à un modèle mathématique, mais à un modèle du vivant et de l’objet en employant “ l’explication finaliste ”, i.e., la logique formelle, autrement dit le raisonnement explicatif de l’individu. Selon Aristote, la métaphysique (ce qui vient après le physique) expose des couples conceptuels forme-matière, acte-puissance, fin-moyen, qui permettent l’explication du mouvement dans le temps et l’espace, et du devenir (la finalité). La métaphysique pour Aristote comprend également une théorie de l’être (personne) en tant ‘qu’acte-pur’, premier moteur, i.e., ‘pensée de la pensée’. Il ressort de l’oeuvre d’Aristote et de ses couples conceptuels, quatre types de cause. D’après lui, une cause peut être matérielle, formelle, efficiente ou finale. Afin d’expliquer la causalité des objets observables, i.e. de la réalité des choses, il prend l’exemple d’un vase en argile fabriqué par un potier. Selon l’auteur, le vase est l’effet d’une quelconque cause: L’argile serait la cause matérielle du vase, la forme, serait sa cause formelle, l’énergie investie par le potier serait sa cause efficiente, et enfin, l’intention du potier serait la cause finale du vase. Mais la notion de cause finale chez Aristote inclut une explication théologique, réfutée par les scientifiques modernes. Néanmoins pour Aristote tous les effets ont un but, i.e., toute chose se produit selon un propos (telos). D’autre part, les causes matérielles et formelles d’Aristote sont mises en doute par les scientifiques. En effet, l’essence peut-elle causer un feu? La cause efficiente est quant à elle proche de ce que les physiciens entendent par X cause Y, i.e., X est un événement qui produit un autre événement Y dans le contexte de la science moderne où à une causalité correspond un corrélât empirique.

Contre toute attente, Aristote fait implicitement émerger la notion de multiplicité des causes pour une conséquence donnée, scientifiquement théorisée par Galilée et que Mackie (1980) nommera plus tard “ circonstances causales ”, ou terrain (champ) causal constitué de multiples conditions qui amènent à l’occurrence d’un événement particulier.

Galilée (1620) est le premier scientifique qui ait considéré une cause comme étant un ensemble de conditions nécessaires et suffisantes pour l’apparition d’un effet. Si X et Y sont des causes de Z, alors si et seulement X ou si seulement Y se produit, alors Z se produira. Cette causalité peut aussi se définir de la manière suivante: Si X et Y se produisent, alors Z se produira. Cette conceptualisation de la causalité implique que pour qu’un Z donné se produise, la liste de ses causes devra inclure tout facteur qui pourrait conduire ne serait-ce qu’à une infime variation de Z. Cette liste serait si longue qu’il serait impossible de ne pas trouver quelque chose qui ne serait pas une cause de Z. Il est donc impossible de tester toutes les hypothèses causales qui se posent et par conséquent la définition de Galilée est quasi inutile pour les scientifiques. Néanmoins avec cette théorie émerge le problème posé par une conceptualisation de la causalité en tant que relation oui/non, ce que Hume (1748) tentera de résoudre des années plus tard en établissant les bases d’une approche moderne de la causation. Hume a ainsi introduit trois grandes idées révolutionnaires qui jusque là étaient considérées comme acquises par les autres philosophes (voir interprétation de Pearl, 1996, 2000) mais qui sont toujours utilisées dans l’approche causale du domaine de l’intelligence artificielle.

Tout d’abord, il fit une distinction entre des postulats analytiques (produits de la pensée) et empiriques (qui découlent des faits), ce qui l’a conduit à classer les postulats causaux dans le domaine de l’empirique plutôt que dans celui de l’analytique. Sa définition de la causalité repose donc principalement sur des notions qui peuvent être vérifiées par des observations. Enfin, il a identifié la source de tous postulats empiriques concernant l’expérience humaine, notamment les input sensoriels. En effet, il a été le premier à rejeter l’existence du concept de cause en postulant que la causalité est plus une perception qu’une réelle relation entre deux choses. Selon Hume, X cause Y si X précède Y dans le temps (antériorité), si X et Y sont continus dans l’espace temps alors il y a continuité et si X et Y se produisent toujours ensemble, il y a alors conjonction constante. Selon Clarke (1738) contemporain de Hume, les choses dépendantes sont des contingences modales qui commencent et cessent d’exister de telle sorte qu’elles peuvent être identifiées selon des états successifs de l’univers. Son argument est qu’une infinie succession de choses plus ou moins dépendantes, sans aucune cause externe serait une série de choses qui n’a pas de cause. Clarke (1738) a été interprété par Smith (1995) de la manière suivante:

“ Si on considère la clause 1: Chaque chose dépendante est un effet d’une autre chose dépendante antérieure, cette clause n’entraîne pas la seconde: Clause 2, il y a une explication causale de pourquoi la série infinie de choses dépendantes existe. ”

Dans cette suite de propositions, la clause 1 suggère une succession de choses reliées causalement et la clause 2 l’explication causale de la succession. Hume (1748) postule que si chaque chose dépendante à une cause, alors contrairement à Clarke (1738), la série de choses a une explication causale suffisante. Ces deux philosophes contemporains (Clarke et Hume) avaient une définition différente de la causalité. Néanmoins, Hume semble être celui dont la pensée a perduré, bien qu’elle ne satisfasse pas entièrement aux représentations qu’un individu peut se faire de la causalité.

En effet, si l’on considère que ‘le jour cause la nuit’ (Pearl, 1998), cette proposition satisfait tous les critères de Hume mais cependant, elle ne satisfait pas nos attentes sur la causalité. Le jour ne cause pas la nuit, donc la définition de Hume reste incomplète, ce qui pose des problèmes aux scientifiques modernes et à leur méthode. La continuité spatiale semble être bien acceptée. En effet si une cause se produit à un endroit, on s’attend à ce que son effet se produise au même endroit. Mais si on se place dans le contexte historique de l’émergence de la philosophie de Hume, on peut dire que le critère de continuité spatiale rejette le modèle gravitationnel de l’univers par Newton. Les orbites des planètes, ainsi que d’autres phénomènes mécaniques requièrent une action à distance, notion largement acceptée par les philosophes et quelques rationalistes stricts. Selon ce point de vue, tout changement est sujet au principe de raison suffisante (a priori). Toute transition est sujette à des lois puisqu’afin qu’un changement se produise, il doit y avoir une raison suffisante. Mais la continuité ne peut pas être vérifiée empiriquement. L’antériorité semble aussi être bien acceptée. Si une cause se produit, on attend son effet le lendemain ou la semaine d’après, et non la veille ou la semaine précédente. Les causes doivent précéder les effets, ce qui implique un délai entre une cause et son effet. Kant a utilisé l’exemple de la bille de plomb reposant sur un coussin et causant une impression de densité sur le coussin. La bille de plomb (X) a-t-elle causé l’impression (Y)? Si tel est le cas, X et Y se produisent simultanément. Donc, bien que Hume ait postulé que ‘les effets ne peuvent se produire avant les ‘causes’, la simultanéité des événements semble être acceptable. Kant (1948, 3ème antinomie) soutient que la catégorie cause/effet ne s’applique pas aux choses elles-mêmes, mais uniquement aux apparences. L’application de la catégorie de relation cause/effet aux objets eux-mêmes conduirait à un déterminisme strict, selon lequel toute altération qui se produirait serait sujette aux lois de la nature. Appliquer les relations de causalité aux apparences requiert un ‘schéma’ (Kant, 1948, 2ème antinomie). Schéma de cause/effet qui serait une succession dans laquelle une même substance ne pourrait pas se trouver aux différents états successifs. A chaque étape de la chaîne causale la substance change et ne peut par conséquent pas se retrouver dans le même état dans les états temporels successifs. Ainsi, Kant rejette le scepticisme de Hume en postulant que les apparences sont sujettes à des lois causales.

Le critère le plus controversé de Hume est le troisième: la conjonction constante. Cette controverse peut être mise en évidence par les résultats hypothétiques d’une expérience simple. 1000 colonies de bactéries sont cultivées, 500 d’entre elles sont traitées avec un supposé agent anti-bactérien, et les 500 autres sont traitées avec un placébo. Si X représente le critère anti-bactérien de conjonction constante, la controverse peut s’illustrer de la manière suivante:

OUI NON
X SE PRODUIT ? OUI 500
NON 500

est consistant avec “ X cause Y ” . Des résultats différents montrent:

OUI NON
X SE PRODUIT ? OUI 495 5
NON 5 495

Ce qui nous amène à la conclusion “ X ne cause pas Y ”.

Ce résultat hypothétique met en évidence la nature problématique du critère de conjonction constante. Si l’on applique le critère de Hume, il y aurait très peu de relations causales dans le domaine de la biologie et des sciences en général, puisque la conjonction constante qui se rapproche de la notion de vérité avec la répétition de phénomènes à l’infini ne peut être appliquée.

En comparant les causalités de Hume et de Galilée on se rend compte de l’évolution de la pensée causale. Bien que Galilée soit un scientifique, sa définition de la causalité n’était pas clairement empirique. D’un autre côté, Hume est clairement empirique. Sa causalité est basée sur des relations sensorielles ou d’expérience (voir aussi Piaget, 1961 et sa théorie génétique de développement sensori-moteur). Hume postule que “ X cause Y ” ne peut pas être empiriquement vérifié, mais que néanmoins, une relation causale hypothétique peut être testée.

Une des approches du problème pratique posé par le critère de conjonction constante de Hume est de considérer ce critère comme probabilistique. Si la probabilité que Y se produise étant donné que X s’est produit (P(Y/X), alors la conjonction constante requiert que P(Y/X)=1 et P(Y/-X)=0, où -X indique que X ne s’est pas produit. Le problème qui persiste est que les phénomènes sociaux et biologiques en théorie ne satisfont pas à ce critère. Les causalités probabilistiques résolvent ce problème en ne requérant que l’apparition de X rend l’apparition de Y plus probable. Donc, si P(Y/X) > P(Y/-X), alors “ X cause Y ”. Ceci rend le critère de conjonction constante plus pratique, cependant, il met en évidence d’autres problèmes. Supposons que X a deux effets; Y1 et Y2, et que Y1 précède Y2. L’événement atmosphère électrique cause éclair et tonnerre. Puisque nous voyons toujours l’éclair (Y1) avant le tonnerre (Y2), il apparaît que l’éclair cause le tonnerre. En effet, Y1 et Y2 satisfont le critère probabilistique P(Y2/Y1) >P(Y2) requis de Y1=>Y2. Mais en fait, l’éclair ne cause pas le tonnerre. Patrick Suppes (1970; spécialiste de la causalité probabiliste) résout ce problème, en requérant que Y1 et Y2 n’ont pas de cause commune. La notion qui ressort essentiellement de ces travaux est que la causalité se limite aux relations de causalité physique. Or la causation telle que Mackie la définira plus tard englobe toutes les relations causales de quelque nature qu’elles soient.

Un siècle après Hume, la théorie de la causalité a évolué avec John Stuart Mill (1843) qui s’est concentré sur les problèmes d’opérationnalisation de la causalité. Il postule que la causalité ne peut être mise en évidence sans expérimentation. Il faut donc que la causalité soit étudiée dans les limites d’une situation particulière. Il a mis en place quatre méthodes générales afin d’établir la causation. (1) La méthode de variation concomitante, (2) celle de différence, (3) celle des résidus et enfin (4) celle de concordance. Tous les protocoles expérimentaux modernes sont plus ou moins basés sur une ou plusieurs de ces méthodes.

En résumé, l’histoire de la causalité peut se diviser en deux époques différentes. La première époque commence avec Aristote et se termine avec Hume. La seconde débute avec Mill (1843) et se perpétue de nos jours (Mackie, 1980). La causalité de Hume était largement conceptuelle, et tenait pas compte des problèmes pratiques de l’implémentation des concepts. Mill a quant à lui décrit comment les scientifiques pouvaient implémenter (ou opérationnaliser) la causalité. Il a été le premier à faire ressortir la notion de terrain causal et la possibilité d’obtenir des ‘vérités causales’ dans un contexte expérimental.

La plupart des causalités proposées fonctionnent parfaitement dans un contexte donné mais pas dans un autre. Afin de résoudre ce problème, les philosophes modernes ont essayé de limiter leur causalité à des contextes spécifiques, des circonstances, ou des conditions. La causalité est alors définie dans le contexte limité du milieu expérimental. Selon la théorie de causalité expérimentale, toute relation démontrée dans une expérience est une relation causale valide. Toute relation qui ne peut pas être démontrée dans une expérience n’est pas causale. Le dilemme fondamental de la causalité est qu’en utilisant une unité expérimentale, afin de démontrer que X cause Y, nous ne pouvons pas utiliser la même unité afin de démontrer que non-X ne cause pas Y. En effet nous pensons que si une cause n’apparaît pas, il est fortement probable que la conséquence n’apparaisse pas et par conséquent, il n’existe plus de relation causale à appréhender et déterminer. Ce dilemme est résolu en supposant que toutes les unités sont plus ou moins les mêmes. Suppes (1970) a proposé une autre causalité définie pour un milieu limité (causalité probabilistique). Selon sa théorie, X et -X dénotent respectivement l’apparition et la non-apparition de X. Suppes (1970) infère ensuite que X=>Y si deux conditions sont satisfaites: (1) P(Y/X) >P(Y/-X), et (2) P(Y/X et Z) = P(Y/-X et Z). Le premier critère garantit que la probabilité pour que Y se produise étant donné que X s’est produit est plus grande que la probabilité complémentaire que Y se produise étant donné que X ne s’est pas produit. Le second critère garantit que X et Y ne sont pas des co-effets asynchrones de Z.

Ainsi, une relation de cause à effet est la distinction faite entre les événements inclus dans une relation causale, dans laquelle l’apparition de l’un (la cause) est supposée produire l’apparition de l’autre événement (l’effet). Bien que l’analyse de la causation ait fait l’objet de nombreuses discussions, Hume a proposé une critique intéressante de notre penchant pour inférer une connexion nécessaire à partir de probables régularités. Mill a proposé un ensemble de méthodes qui permettent de reconnaître la présence d’une relation causale. Les philosophes contemporains supposent dans leur majorité qu’une relation causale s’exprime notamment à l’aide de l’énoncé contrefactuel qui préconise que si une cause n’apparaît pas, alors l’effet ne se produira pas. Ce raisonnement contrefactuel est établit grâce aux croyances causales de l’individu, qui lui permettent d’établir la cohérence du monde qui l’entoure et de ses pensées. La cohérence est le sentiment qu’un individu peut avoir au cours du traitement de l’information présentée, i.e., croire qu’une proposition est vraie d’après l’étendue selon laquelle elle est en accord avec les autres propositions. La théorie de la cohérence de vérité suppose que les croyances marquantes constituent un système inter-relié dans lequel chaque élément justifie les autres. Ainsi, les idéalistes ont défendu différentes versions de cette théorie de cohérence. Différents types de vérité cohérente peuvent être établis à l’aide de la distinction entre deux concepts philosophiques de vérité que sont la vérité nécessaire et la vérité contingente. La vérité nécessaire est un trait de chaque énoncé qu’il serait contradictoire de dénier. En effet, les contradictions elles-mêmes sont fausses. Les vérités contingentes, se trouvent être vraies (ou fausses), mais elles peuvent avoir été tout autres. Par exemple: ‘Les carrés ont quatre côtés’ est nécessaire. ‘Les signaux “ stop ” sont hexagonaux’ est contingent. ‘Les pentagones sont ronds’ est contradictoire.

Cette distinction a été traditionnellement (avant Kant) appliquée aux distinctions entre les connaissances à priori et à postériori ainsi qu’aux distinctions entre les jugements analytiques et synthétiques. La nécessité peut aussi être définie en termes de propriété logique formelle de tautologie. Ceci nous amène à la force d’une relation causale déterminée par la nécessité et la suffisance. En effet, nécessité et suffisanceest une distinction qui se fait entre les conditions logiques et les conditions causales. En logique une proposition est une condition nécessaire pour une autre lorsque la seconde proposition ne peut pas être vraie tant que la première est fausse, et une proposition est une condition suffisante pour une autre lorsque la première ne peut être vraie tant que la seconde est fausse. Ainsi, nous pouvons dire que ‘J’ai un chien’ est une condition nécessaire pour ‘Mon chien a des puces’, et ‘Vous avez 99% de bonnes réponses’ est une condition suffisante pour ‘Vous avez 20/20’.

Dans les relations causales, une condition nécessaire pour l’apparition d’un événement est un état sans lequel l’événement ne peut se produire, tandis qu’une condition suffisante est un état qui garantit que cet événement va se produire. Ainsi, la présence d’oxygène est une condition nécessaire pour la combustion, et le flux du courant électrique est une condition suffisante pour l’induction d’un champ magnétique (Swartz, 1990, van den Broek, 1990).