43. La procédure d’estimation et les principes d’évaluation des modèles de choix discrets

431. La procédure d’estimation des modèles de choix discrets

La procédure d’estimation d’un modèle de choix discret se fait habituellement en utilisant la méthode du maximum de vraisemblance, introduite dans les années 1920 par Ronald Fisher. Elle consiste à définir à l’aide d’un échantillon d’individus et de probabilités données par le modèle, une « fonction de vraisemblance » note L( θ ) et à chercher la valeur des θ i qui rend cette fonction maximum. Le plus souvent, on a comme information pour chaque échantillon d’individus :

  • le choix effectué,

  • les valeurs des caractéristiques des individus,

  • les valeurs des caractéristiques des différentes alternatives.

Un modèle de choix discret est estimé sur un échantillon. Le maximum de vraisemblance correspond à la recherche de la valeur des paramètres qui permettent de mesurer la probabilité (que l’on doit maximiser) qui est la plus proche d’avoir généré l’échantillon observé (Certu, 1998).

Une hypothèse nécessaire pour pouvoir appliquer la méthode du maximum de vraisemblance est que l’échantillon sur lequel se fait le calcul est le résultat de tirages indépendants dans une population ayant une distribution multinomiale dont les probabilités sont données par le modèle logit. La fonction de vraisemblance exprime la probabilité d’obtenir l’échantillon de N observations indépendantes (X 1 ,...X N) étant donnée la distribution de probabilité P(Xi, θ ) qui est le modèle dont on cherche le vecteur des paramètres θ à estimer ; cette fonction de vraisemblance peut se décomposer sous forme d’un produit grâce à l’hypothèse d’indépendance entre les x i.

message URL FORM171.gif
L’approche consiste à considérer l’échantillon d’observation (X N) comme donné et θ comme une variable dont on cherche la valeur qui maximise la vraisemblance de l’échantillon (X N), c’est-à-dire la quantité L ; soit message URL teta.gif la valeur cherchée de θ. θ message URL teta.gif vérifie :
message URL FORM172.gif

message URL FORM173.gif

L’estimateur du maximum de vraisemblance (EMV) est la valeur de θ qui maximise le log de la vraisemblance :

message URL FORM174.gif