Dans le cas où le processus Yt est totalement autorégressif, l’ensemble des réalisations de Y sur t (Y0, ..., YT) ont une probabilité de réalisation simultanée ou loi jointe notée :
Dans cette perspective, à chaque instant du temps (t) la probabilité de transition de Y d’un état i en t-1 à un état j en t (Pi t-1 j t(t) que nous notons Pij(t)) dépend de l’ensemble des réalisations passées de Y (Yt-1, ..., Y0).
Une chaîne de Markov d’ordre p peut alors être définie comme un cas particulier de processus autorégressif dans lequel seulement p retards sont considérés (autorégressif d’ordre p, AR(p)). L’horizon temporel pris en compte dans les trajectoires est limité à p périodes et l’ensemble des trajectoires peut donc se noter Ep={ei=[j1, ..., jp]} avec i variant de 1 à Jp. On obtient ainsi des probabilités de transition de la forme suivante :
Les matrices de transition construites à cette occasion (notées Pp(t)) sont de dimension MxM (avec M=Jp). Elles croisent deux à deux toutes les trajectoires ei potentiellement observables en p périodes comme dans la Figure 17 au dessous.
Les éléments de cette matrice de transition représentent les probabilités de transition Peiej depuis des trajectoire ei du type Yt-p-1=jt-p-1 ; Yt-p=jt-p ; ... ;Yt-2=jt-2 ; Yt-1=jt-1 en t-1 vers des trajectoire ej du type Yt-p=jt-p ; Yt-p+1=jt-p+1 ; ... ;Yt-1=jt-1 ; Yt=jt en t. Dans ce type de matrice la strucutre de dépendance temporelle qui est décrite peut être représentée comme suit :
Dans le cas où les p-1 derniers éléments de la première trajectoire ei (en t-1) et les p-1 premiers éléments de la trajectoire ej (en t) ne sont pas identiques alors la probabilité de transition entre ces deux trajectoires est forcément nulle : on parle de zéro strucutrel.
Des matrices ’réduites’ d’ordre p et de dimension M.(J) notées Rp(t) peuvent alors être construites, dans lesquelles les zéros structurels sont éliminés. Les matrices Rp(t) sont de la forme suivante :
La structure de dépendance temporelle décrite par ce type de matrice est représentée dans la Figure 20 au-dessous :
On notera que le nombre de paramètres à estimer augmente très rapidement173 au fur et à mesure que p croit. Ceci implique l’emploi de techniques spécifiques dès lors que l’on veut estimer des processus autoregressifs d’ordre élevé174 ou comportant un grand nombre de modalités175.
Le nombre de paramètres indépendants à estimer se monte à Jp(J-1) (une fois les zéros structurels éliminés comme dans la matrice de transition réduite Rp.
On parle de High-order Makov Models (HMM).
Pour plus de détails sur le sujet voir dans ce document le paragraphe ’’, et Berchtold [1998], p.26 et suivantes.