2.2.2 Utilisation de techniques de compression d’images

Le système HDMAC, mais aussi et surtout les divers systèmes numériques actuels ou à l'étude, utilisent des techniques de compression d'image afin de réduire les débits transmis, tout en conservant le maximum de qualité à l'image. Ces techniques ont des points communs avec celles étudiées pour l'enregistrement sur des supports numériques (disques magnétiques ou optiques). Ce sont notamment27 :

  • le sous-échantillonnage, c'est-à-dire l'adaptation des fréquences d'échantillonnage (spatiale et temporelle) au contenu de l’image : une zone fixe est transmise avec une définition normale et une fréquence plus faible ; une zone en mouvement est transmise avec une définition réduite et une fréquence normale. En HDMAC, comme en Muse, on divise par 4 le nombre d’échantillons : dans les zones fixes, un point sur 4 est analysé à chaque trame, avec décalage à la trame suivante des points analysés. En 4 trames (fréquence équivalente de 6,25 Hz) tous les points ont été analysés. Les points manquants sont reconstitués par interpolation avec filtrage.

Dans les zones mobiles, un point sur 4 est analysé, à la fréquence normale de 25 Hz. Le HDMAC utilise une catégorie intermédiaire de zone en «mouvement lent », analysée à 12,5 Hz :

  • le brassage, mélange de deux lignes voisines, permet d'être compatible avec la définition standard
  • le codage différentiel avec prédiction (cf. chapitre sur la numérisation des signaux), qui permet de profiter des fortes redondances d'une ligne à l'autre et d'une image à la suivante. En vidéo, la prédiction peut être multidimensionnelle, en utilisant l'information des points précédents, des lignes précédentes et des images précédentes. Elle est donc beaucoup plus efficace que pour le son qui est un signal unidimensionnel.

D'un point de vue théorique, il s'agit d'un «codage de source», destiné à réduire les redondances du message d'origine, sans perte d'information. Son efficacité dépend donc beaucoup du contenu de l'image de départ. Elle peut être élevée pour le visiophone, où l'image comporte peu de détails et varie lentement. En cas de transitoires rapides, les mouvements sont en général détériorés :

a). 'utilisation de codes à longueur variable (Shannon, Hoffman...), dit aussi codes entropiques, où un mot est traduit par un code d'autant plus court que ce mot est plus probable. Plus complexe que les codes à longueur fixe, cette technique (qui est également un codage sans perte) est intéressante en codage différentiel, où les différences petites sont plus probables que les grandes.

b). l'utilisation de transformations mathématiques (Fourier, cosinus. matricielles...) suivies d'un filtrage permettant, à débit égal, de transmettre une plus grande quantité «subjective» d'informations, ou de réduire le débit à qualité subjective égale. On a affaire cette fois à un codage «avec pertes». Ces transformations, bidimensionnelles, se font sur des blocs réduits (8 x 8 dans le visiophone RNIS par exemple) et sont en général associées à la prédiction de mouvement du bloc. 

c). la prédiction de mouvement d'une image à l'autre. Elle a pour but de détecter le mouvement global, translation, plus difficilement rotation d'un bloc, d'une image à l'autre, et renforce l'efficacité du codage différentiel, puisqu'elle transmet une information (bidimensionnelle) de déplacement du bloc au lieu d'une information de différence pour chacun de ses points. Elle permet de plus d'interpoler une position intermédiaire du bloc dans une trame non transmise, entre deux trames transmises, en cas de sous échantillonnage (technique de compensation de mouvement du HDMAC).

Alors que les deux premières techniques peuvent se pratiquer sur des échantillons analogiques, les suivantes sont totalement numériques. Il faut rappeler que plus le codage n’est efficace en termes de réduction de débit, plus il est sensible aux erreurs, et que l'emploi d'un code correcteur d'erreurs s'impose.

Un cas particulier est celui des images à deux niveaux (noir et blanc), par exemple la télécopie, qui bénéficie de possibilités de compression supplémentaires : on peut transmettre uniquement les coordonnées des points noirs (statistiquement beaucoup moins nombreux que les blancs), les longueurs des zones blanches, ou les coordonnées des contours, préalablement analysés en deux dimensions. Cette réduction du débit permet d'augmenter la résolution spatiale.

Notes
27.

Ibid. p 348.