2.4.6. La catégorisation par apprentissage automatique

Ces méthodes consistent à catégoriser les situations de conduite à l'aide d'algorithmes informatiques. Le principe général est d'établir une fonction de correspondance entre, d'une part, un ensemble de caractéristiques représentatives des situations et d'autre part, un ensemble de catégories. Cette fonction de correspondance peut être apprise par les algorithmes informatiques par des mécanismes d'apprentissage supervisés ou non. Dans le cas de l'apprentissage supervisé, un expert est employé pour étiqueter correctement des exemples. L'algorithme doit ensuite trouver ou approximer la fonction qui permet d'affecter la bonne étiquette à ces exemples. Le but d'un algorithme d'apprentissage non-supervisé est de déterminer par lui-même des catégories en regroupant les échantillons qui lui sont présentés. Pour cela, ces algorithmes ne se basent que sur des propriétés de répartition génériques définies a priori. Dans le cas des algorithmes supervisés, ils généralisent, pour des entrées inconnues, ce qu'ils ont pu apprendre grâce aux données déjà traitées par des experts.

Les travaux réalisés à l'Inrets par Dapzol ont montré que pour que ces méthodes fonctionnent, elles devaient prendre en compte les propriétés d'enchaînement temporel des événements entre eux. Dans le projet Cemvocas, Tattegrain-Veste et al. ont mis en œuvre une catégorisation des situations en temps réel basée sur des réseaux de neurone. Ce projet permet une classification de 85% des situations en termes de disponibilité du conducteur à recevoir un message sonore. Mais, l'amélioration des taux de reconnaissance était difficile du fait du caractère « boîte noire » des réseaux de neurones. En effet, à cause de la non-interprétabilité du système, l'ajout de nouveaux facteurs explicatifs était hasardeux. Bien que ces ajouts amélioraient la reconnaissance de certaines situations, ils la réduisaient pour d'autres.

Finalement les meilleurs résultats consistent à mixer les méthodes d'apprentissage automatique et des méthodes de modélisation par des experts. Dans cette optique, McCall, Wipf, Trivedi & Rao ont utilisé les réseaux bayésiens pour prédire les changements de voie sur autoroute. Les connaissances des experts interviennent dans l'architecture du réseau bayésien tandis que les connaissances apprises par l'algorithme interviennent sous forme de valeurs de probabilité associées aux branches du réseau. Dans cette approche mixte, Dapzol propose un modèle Semi-Markovien Caché Pondéré (MSMCP).

Le principe des Modèles de Markov Cachés (MMC), est fondé sur l'hypothèse que le signal étudié peut être divisé en plusieurs phases qui représentent un processus sous-jacent "invisible". Dapzol applique ce principe pour segmenter une séquence de conduite en fonction de différents paramètres observés : pédales, volant, vitesse, clignotant (Figure 23).

Figure 23 : Découpage d'un épisode de franchissement de rond point, (Dapzol 2006)

Dans cette approche, les connaissances des experts interviennent : a) pour le choix initial des séquences servant de base à l'apprentissage, b) pour le réglage des paramètres de pondération, c) pour le choix du nombre de phases a priori, d) pour l'interprétation des différentes phases obtenues par l'algorithme. Ce choix de nombre de phases peut se baser sur un modèle cognitif tel que proposé dans Cosmodrive, présenté au paragraphe 2.4.5.1, et correspond aux zones d'un schéma tactique (Figure 24).

Figure 24  : Franchissement de rond point, (Dapzol 2006)

Plus généralement, cette approche s'inscrit dans le domaine de la "reconnaissance automatique d’activité". Dans ce domaine, on trouve l’idée que des événements extraits automatiquement à partir des données doivent se voir affecter une valeur sémantique , et qu’il faut les traiter en différents niveaux de contrôle , .