Vidéo numérique

Transcription

Vidéo numérique
Les formats de vidéo numérique
De la vidéo analogique à la vidéo numérique
Avant de détailler les différents formats employés dans la vidéo numérique, il
est important d’aborder le concept de la vidéo analogique et de sa conversion en
format numérique. En effet, certaines caractéristiques universellement
employées en vidéo numérique ne peuvent s’expliquer que par la transition qui
a eu lieu avec la vidéo analogique. Comme dans toute évolution, dans n’importe
quel domaine, il faut tenir compte du passé pour établir les bases du présent et
du futur, même si cela est souvent contraignant et ralentit forcément la
cadence !
Principe de l’acquisition vidéo analogique
Une carte d’acquisition vidéo au format analogique convertit le signal analogique en signal numérique grâce à un composant électronique qui transforme le
niveau de tension à un instant T en une donnée binaire qu’un ordinateur peut
facilement traiter et stocker. Pour que la vidéo soit de la meilleure qualité possible, il faut que le convertisseur analogique/numérique analyse le plus de fois
possible le signal analogique (fréquence d’échantillonnage) avec le maximum
de précision (codage réalisé sur X bits). C’est la même technique qui est
employée pour coder un CD audio à partir d’un son (fréquence de 44,1 kHz en
16 bits stéréo).
En vidéo, les formats de numérisation sont les formats 4:2:2, 4:1:1 et 4:2:0, qui
déterminent la qualité de la numérisation. Cette qualité est en général indiquée
par le constructeur de la carte d’acquisition vidéo.
Pour saisir le principe des formats 4:2:2, 4:1:1 et 4:2:0, il faut déjà comprendre
comment fonctionnent l’affichage de la vidéo sur une télévision et les moyens utilisés pour transporter le signal de la manière la plus économique possible en
matière de "bande passante".
Info
La bande passante fait toujours appel à une notion de signal électrique :
c’est la capacité d’un composant, d’un équipement ou d’un simple fil à
transmettre des signaux électriques avec une qualité optimale entre
telle et telle fréquence. Pour exemple, une chaîne à la norme Hi-Fi possède une bande passante de l’ordre de 20 kHz parce qu’elle sait reproduire des sons dont la fréquence est comprise entre 20 Hz et 20 kHz. Sur
cette notion vient se greffer celle du signal sur bruit, qui détermine un
ratio entre le signal réellement utile et les sons parasites. En vidéo, les
bandes passantes se situent entre 3 et 6,3 MHz, en fonction du type de
signal vidéo et de son utilisation.
67
68
Présentation de la vidéo numérique
Du RVB (ou RGB) au YUV
Les composantes fondamentales pour l’affichage de la télévision sont le
rouge, le vert et le bleu : c’est à l’aide de la juxtaposition de chacune de ces
trois composantes et en fonction de leur intensité que l’on recompose toutes
les couleurs visibles par l’œil humain. Chaque point qui réunit ces trois composantes fondamentales est appelé un pixel : la résolution maximale du système de télévision PAL ou SECAM (utilisé en France) est de 720 pixels
horizontaux par 576 pixels verticaux. Il faut toutefois comprendre que la télévision n’aurait pas pu prendre son essor si l’on en était resté à un système de
transmission des signaux utilisant ces trois composantes : la quantité de bande
passante nécessaire à chaque composante est de 10 MHz, ce qui est énorme si
l’on pense à la diffusion télévisuelle par ondes hertziennes, ou même aux
enregistrements sur magnétoscopes (à l’époque où les standards ont été inventés, en 1956, on n’imaginait pas une bande passante de 30 MHz consacrée à
une seule chaîne de télévision, pour des raisons toutes simples de disponibilité
de technologie et de hauteur insuffisante des ondes radio pour la porteuse).
Pour information, le Tableau 3.1 indique les bandes passantes des différents
systèmes de stockage et de diffusion de vidéo.
Info
Le système d’entrelacement des images par demi-trame a été inventé
pour diviser par deux la bande passante nécessaire. Un codage RVB de
télévision couleur nécessite "uniquement" 15 MHz, au lieu de 30 !
Tableau 3.1 : Bande passante des principaux systèmes de stockage
et de diffusion de vidéo
Système
Bande passante
Magnétoscopes VHS et 8 mm (y compris Caméscopes)
3 MHz
Magnétoscopes U-Matic (bandes Ω de pouce)
3,1 MHz
Magnétoscopes U-Matic SP
4,1 MHz
Signal de diffusion hertzienne de télévision composite
NTSC
4,1 – 5 MHz
Magnétoscopes et Caméscopes S-VHS et Hi 8
5 MHz
Laserdisc
5,3 MHz
Signal de diffusion hertzienne de télévision composite
PAL
5 – 5,5 MHz
DVD vidéo
6,3 MHz
Format DV
6,3 MHz
Les formats de vidéo numérique
Pour remédier aux différents problèmes de qualité vidéo, il a fallu faire le choix
de limiter la bande passante tout en essayant de garder une qualité d’information maximale. Avec le format YUV de transmission de signaux vidéo, et pour
une qualité équivalente à celle du RVB, la bande passante a une capacité de
10 MHz (de 6 à 10 MHz en réalité), soit une capacité trois fois inférieure à celle
du RVB natif et inférieure de 33 % à celle du signal PAL entrelacé en RGB.
Comment est-on arrivé à cela ? Tout comme en informatique, et bien avant que
le premier ordinateur personnel ne naisse, les ingénieurs ont réfléchi au principe
des images en couleur composées de rouge, de vert et de bleu.
Le vert est composé de bleu et de jaune : on peut donc envisager de coder le signal
en partant du principe que le vert est du jaune avec plus ou moins de bleu, ou plus
simplement de régler un signal vert par défaut avec plus ou moins de bleu (certaines vieilles télévisions, quand elles commencent à chauffer, n’affichent que du
vert) pour donner un éventail de tons qui s’étendent du jaune au bleu.
L’œil humain distingue plus facilement le vert que le rouge et le bleu, selon un
ratio de 60/30/10 : dans ce cas, pourquoi coder une information bleue avec
autant d’importance que celle du vert ou du rouge puisqu’elle n’intervient qu’à
10 % dans le résultat ?
Qu’est-ce qui différencie un jaune d’un autre jaune ? L’intensité de la lumière !
Comme résultat de leurs réflexions, les ingénieurs ont pensé à un codage du
genre "compression analogique", appelé YUV.
• Y est une information de luminance avec une bande passante de 6 MHz
qui correspond à l’addition des valeurs des composantes rouge, vert et bleu
selon l’équation Y = 0,3 R + 0,6 V + 0,1 B (en rapport avec la perception
des couleurs de l’œil humain).
• U est une information qui correspond à une soustraction entre le bleu et la
luminance (Chrominance – Bleu, Cb), avec une bande passante de 1,5 MHz.
• V est une information qui correspond à une soustraction entre le rouge et
la luminance (Chrominance – Rouge, Cr), avec une bande passante de
1,5 MHz.
• Le vert est recomposé à partir des trois signaux.
Le format YUV présente l’énorme avantage d’être compatible avec les télévisions noir et blanc grâce au simple signal Y, fonction qui s’est avérée très
importante à l’époque où la télédiffusion en couleur a fait son apparition.
Les signaux RVB se recomposent électroniquement selon ces équations :
R = Y + (R – Y)
V = Y – 0.51 (R – Y) – 0.186 (B – Y)
B = Y + (B – Y)
69
70
Présentation de la vidéo numérique
Toute l’analyse des ingénieurs a été fondée sur le principe que les composantes
RVB pouvaient représenter un espace tridimensionnel selon les axes R, V et B et
que l’on pouvait de ce fait reconstruire un autre espace pouvant être limité dans
le spectre visuel humain.
Ces équations se matérialisent sous forme électrique par des modulations de
signaux et des décalages de phases.
Nous arrêterons là les explications relatives au mode YUV : l’essentiel est de
comprendre qu’il existe un rapport direct entre le RVB et le YUV (même si le
mode YUV perd sa matérialité par rapport au mode RVB), en sachant que le YUV
est à la base de tous les traitements de vidéo numérique et qu’il est dans ce cas
plus juste de l’appeler YCbCr : ce sont les échantillonnages des signaux YCbCr
qui donnent les formats 4:4:4, 4:2:2, 4:1:1, 4:2:0.
Info
Le signal Y/C utilisé en S-VHS avec le format de prise S-Video est le
résultat d’une autre équation qui consiste à garder le signal de luminance Y et à réaliser une opération entre U et V. L’équation en question
est C = U*Cos(t) + V*Sin(t).
Info
Le signal RVB est celui qui offre la meilleure qualité, viennent ensuite le
signal YUV, le Y/C et, enfin, le signal composite (encore une équation),
qui permet de relier les signaux Y et C ou Y, U et V.
Du format 4:4:4 au format 4:2:2
Comme nous venons de l’entrevoir, une fois que le signal est matérialisé sous
la forme YUV, les techniques de conversion analogique vers numérique peuvent varier à l’infini. Le principe est d’échantillonner le signal de luminance à
un certain taux, et les signaux de chrominance à d’autres taux inférieurs ou
égaux.
Pour échantillonner le signal vidéo, on procède comme pour l’échantillonnage
d’un signal audio. Mais comme il y a trois informations à synchroniser, on a établi une norme qui consiste à travailler sur une base d’échantillonnage de quatre
pixels du signal de luminance et à faire varier l’échantillonnage des autres
signaux de chrominance avec un ratio qui est fonction de celui de la luminance.
La Figure 3.1 illustre l’échantillonnage réalisé avec un ratio 4:4:4 si l’on prend
le signal vidéo de manière totalement linéaire : on échantillonne les signaux de
chrominance autant de fois que le signal de luminance. On aurait pu appeler
l’échantillonnage 4:4:4 échantillonnage 1:1:1 s’il n’y avait eu une bonne raison
de l’appeler ainsi.

Documents pareils