2.1.3.4.4.Estimation des modèles LOGIT

Les modèles LOGIT sont estimés sur base du critère de maximum de vraisemblance. Cette méthode consiste à estimer les valeurs des coefficients a qui reconstituent au mieux les choix réalisés par les personnes enquêtées, et ce afin d’obtenir la probabilité de choix du titre effectivement choisi par l’enquêté la plus grande possible.

On appelle vraisemblance le produit de ces probabilités que l’on cherche à maximiser :

On maximise généralement le logarithme népérien de la vraisemblance qui dépend de la taille de l’échantillon N :

La fonction de vraisemblance étant en général continue selon a, il est possible de la dériver et de l’annuler pour en trouver le maximum. Supposons que l’on ait K variables explicatives (attributs), noté Nk pour indiquer la dépendance à l’échantillon N, dans le vecteur a (en incluant la constante), on a également K coefficients à estimer dans le vecteur a, notés a Nk. Le système d’équations à résoudre devient :

Afin de s’assurer que le maximum obtenu ne soit pas un maximum local, mais bien un maximum global, il faut que la dérivée seconde de la fonction de vraisemblance par rapport au vecteur a soit négative quel que soit a. La négativité de la dérivée seconde assure la concavité de la courbe ce qui permet de prouver que l’on est bien en présence d’un maximum global.

Cette méthode, sous des hypothèses assez générales, possède des propriétés intéressantes. En particulier, une estimation par cette méthode possède les propriétés (asymptotiques) des grands échantillons suivantes (Wonnacott et Wonnacott, 1991) :

Il est donc nécessaire de disposer d’effectifs suffisants pour bénéficier de ces propriétés. Compte tenu de ces propriétés, il est possible de dériver une série de tests, que nous présentons dans le paragraphe suivant.