3.4.e Lecture des résultats et méthode d’interprétation

Avant de passer à l’analyse des résultats, nous précisons comment nous appréhendons les sorties fournies par SAS©et notre démarche d’interprétation. Suite à la procédure de sélection des variables par la méthode de régression pas-à-pas, nous portons une attention toute particulière aux coefficients estimés des variables sélectionnées, leur signe et leur significativité (avec notamment leur intervalle de confiance à 5 %). Pour chaque coefficient estimé, des tests de Wald sont utilisés pour mesurer leur significativité. Le logiciel SAS©fournit en outre une « analyse des effets type 3 » qui correspond à un test de Wald lorsque la variable est introduite en dernier dans le modèle. Cela nous permet de repérer les variables qui apportent une éventuelle redondance d’information au modèle. Nous regardons également quelle est l’information apportée par le modèle (R² de Nagelkerke) et le test d’ajustement de Hosmer et Lemeshow.

L’un des objectifs de notre thèse est d’examiner quelle est la part de la durabilité du système de transports expliquée par les caractéristiques socio-économiques et celle expliquée par les caractéristiques de la forme urbaine. Pour cela, nous utilisons les estimations des rapports de côtes fournies par SAS© . Dans le cas d’une régression logistique binaire, ils permettent de mesurer « l’ampleur » que la variation d’un régresseur entraîne sur le rapport entre la probabilité de réalisation d’une forte dépense et l’ensemble de ses alternatives. Supposons par exemple que le revenu soit une variable explicative significative dans notre modèle pour expliquer la forte dépense des ménages en transport. Formellement, on peut écrire :

Où l’on a P(F.D), la probabilité que le ménage ait une forte dépense en transports urbains, C.L(V.A.) la combinaison linéaire des autres variables explicatives du modèle, Err.Res, l’erreur résiduelle du modèle et β0 la constante du modèle. Si l’on fait varier d’une « unité » notre variable revenu (une unité correspond ici par exemple à une variation de 5 000 € du revenu annuel du ménage), alors on aura :

Cette équation nous montre que l’exponentielle de chaque coefficient estimé mesure l’influence que possède une variation de revenu sur le rapport entre la probabilité de réalisation d’une forte dépense et l’ensemble de ses alternatives (dans notre cas, il s’agit des faibles et moyennes dépenses), lorsque toutes les autres variables explicatives sont maintenues constantes. Si l’interprétation d’un rapport de cote ne pose pas de problème pour des variables qualitatives - la typologie des ménages par exemple - il est nécessaire de procéder à des transformations pour les variables continues. En effet, en reprenant notre exemple sur le revenu, il ne s’agit évidemment pas de déterminer la variation du rapport de cote lorsque le revenu annuel varie d’un seul euro, mais d’une certaine quantité significative en fonction de l’intervalle de variation du revenu sur l’échantillon observé. Nos choix seront donc les suivants :

Un rapport de cotes de 3 n’indique pas que la probabilité de réaliser des fortes dépenses est multipliée par trois mais que le rapport entre la probabilité de réaliser une forte dépense et ses alternatives augmente d’un facteur 3. Dans la suite, nous utilisons l’abréviation RC pour désigner Rapport de Cotes et l’interprétation qui s’y attache. Le RC permettra de comparer les effets des différentes variables dans un modèle et de mettre en évidence les facteurs dont l’influence est la plus importante sur nos trois variables expliquées du tableau VI-3. Concrètement, un RC proche de 1 signifie que la variable explicative influe peu sur les coûts de transports. En revanche, les valeurs nettement inférieures ou supérieures à 1 montreront des effets importants de la part des variables explicatives.