1.2.1. Notations

De manière formelle, on suppose que pour chacun des individus i d’un échantillon de taille N, on observe l’ensemble suivant des variables latentes. L’accès au programme est représenté par une variable aléatoire T, qui prend la valeur 1 si l’individu participe au programme et 0 sinon. L’efficacité du dispositif est mesurée au travers d’une variable de résultat notée Y. En réalité, pour chaque type d’individu, on introduit deux variables latentes, notées Y 0 et Y 1, correspondant aux résultats potentiels de l’individu selon qu’il perçoit le traitement (T=1) ou non (T=0). Celles-ci ne sont, par nature, jamais observées simultanément pour un même individu. En effet, pour un individu ayant participé, Y 1 est observée tandis que Y 0 ne l’est pas. Dans ce cas, la variable Y 0 correspond au résultat qui aurait été observé si l’individu n’avait pas participé, on l’appelle le résultat contre factuel. La variable de résultat total observée se déduit donc à la fois des variables potentielles et de la variable de traitement, telle que :

Y = T Y1 + (1-T) Y0

Ainsi, seul le couple (Y, T) est observé pour chaque individu.