Vidéo numérique

Transcription

Vidéo numérique
Vidéo numérique
Dominique PRESENT
Dépt S.R.C. - I.U.T. de Marne la Vallée
Les applications
• Télévision numérique :
• actuellement diffusée sur le câble et les canaux hertziens
• destinée au grand public
• Vidéo à la demande :
• accès à une banque de données vidéo
• diffusion au moment choisi par le spectateur
• destinée au grand public
• Visioconférence, visiophonie :
• communication temps réel entre personnes ou entre groupes
• destinée au public professionnel, sera étendue au grand public
• DVD :
• stockage sur support individuel
• visualisation en local
• destinée au grand public
IUT Marne la Vallée
vidéo numérique
© D. Présent
1
Numérisation d ’un signal vidéo
Pourquoi numériser ?
• Enregistrement ;
• Manipulation (indexation, stockage) ;
• Montage, modification ;
• Copies, diffusion.
Critères de numérisation.
• Echantillonnage à 13,5MHz ;
• Echantillons par ligne 720 ;
• Dimension d’un échantillon de 8bits à 10bits ;
• Nombre de lignes 525
ou
625.
Remarque :
format de l’image d’un moniteur L/l = 4/3 (ex. : 800x600 en VGA)
Débit brut :
IUT Marne la Vallée
8x3x13,5e6 = 324Mb/s
vidéo numérique
© D. Présent
Image au format 4:2:2 : codage
Recommandation CCIR 601 :
• Echantillonnage luminance à 13,5MHz ;
• Echantillonnage chrominance à 6,75MHz.
Soit par ligne :
• 720 échantillons en luminance ;
• 360 échantillons en chrominance.
Bloc de 6 pixels
sur 6 lignes
luminance
chrominance
• 1 pixel chrominance sur 2
pixels luminance lignes paires
• 1 pixel chrominance sur 2
pixels luminance lignes impaires
IUT Marne la Vallée
vidéo numérique
© D. Présent
2
Image au format 4:2:2 : décodage
Reproduction de l’image 4:2:2 :
• chaque échantillon de chrominance reçu est recopié
pour reproduire le pixel suivant ;
Bloc de 6 pixels
sur 6 lignes
Pixels luminance
Pixels chrominance
reçus
Pixels chrominance
recopiés
IUT Marne la Vallée
vidéo numérique
© D. Présent
Sérialisation de l’image 4:2:2
Suppresion ligne
H-ANC
SAV
1440 éch (Y – Cb – Cr)
EAV
SAV
EAV
H-ANC
EAV : End of Active Video
SAV : Start of Active Video
Données audio
Préamb DID DN DC
DID : identificateur de voie
4canaux de 4 voies
IUT Marne la Vallée
Data
CS
DN : n° du bloc de données
DC : Lg du bloc de données
vidéo numérique
CS : contrôle
© D. Présent
3
Image au format 4:2:0 : codage
ISO 13818 :
• Echantillonnage luminance à 13,5MHz ;
• Echantillonnage chrominance à 6,75MHz ;
• Transmission d’une trame sur 2 en chrominance.
Bloc de 6 pixels
sur 6 lignes
luminance
chrominance
• 1 pixel chrominance sur 2
pixels luminance lignes paires
• 0 pixel chrominance sur les
lignes impaires
Remarques :
• En SECAM, les échantillons Cb et Cr transmis sont une moyenne des échantillons
de 2 lignes successives ;
• Format de base des codages D2MAC et MPEG-2 (MPEG-Main Level MP@ML).
IUT Marne la Vallée
vidéo numérique
© D. Présent
Image au format 4:2:0 : décodage
Reproduction de l’image 4:2:0 :
• chaque échantillon de chrominance reçu est recopié pour
reproduire le pixel suivant ;
• chaque échantillon de chrominance reçu est recopié pour
reproduire les pixels correspondant de la ligne suivante.
Bloc de 6 pixels
sur 6 lignes
Pixels luminance
Pixels chrominance
reçus
Pixels chrominance
recopiés
IUT Marne la Vallée
vidéo numérique
© D. Présent
4
Structure d’une image 4:2:0
Trame 4:2:0
Trame 1- 2:1:0
Trame 2- 2:1:0
Trame
Trame22
(lignes
(lignesimpaires)
impaires)
Trame
Trame11
(lignes
(lignespaires)
paires)
Trame 1 : 288 lignes
de 720 pixels
IUT Marne la Vallée
B-Y
B-Y 144lignes
144lignes
360pixels
360pixels
R-Y
144lignes
R-Y 144lignes
360pixels
360pixels
Luminance
Luminance
288
288lignes
lignes
720
720pixels
pixels
Codage MPEG 1
vidéo numérique
© D. Présent
SIF (Source Intermediate Format)
ISO 11172 (codage des signaux vidéo et audio pour des stockages à 1,5Mb/s) :
• Résolution luminance de 360x240 à une Fimage de 29,97Hz en 525 lignes ;
• Résolution luminance de 360x288 à une Fimage de 25Hz en 625 lignes ;
• Format 4 :2 :0.
Bloc de 6 pixels
sur 6 lignes
luminance
chrominance
• 1 pixel chrominance sur 2
pixels luminance lignes paires
• 0 pixel chrominance sur les
lignes impaires
Remarques :
• Résolution proche de celle d’un magnétoscope VHS ;
•Format de base du codage MPEG-1.
IUT Marne la Vallée
vidéo numérique
© D. Présent
5
Structure d’une image SIF
Trame 4:2:0
Trame 1- 2:1:0
Trame 2- 2:1:0
Trame
Trame22
(lignes
(lignesimpaires)
impaires)
Trame
Trame11
(lignes
(lignespaires)
paires)
Trame 1 : 288 lignes
de 720 pixels
IUT Marne la Vallée
Format SIF :
625 lignes de 360 pixels
B-Y
B-Y 144lignes
144lignes
180pixels
180pixels
R-Y
144lignes
R-Y 144lignes
180pixels
180pixels
Réduction
Réduction
àà352
352pixels
pixels
Codage MPEG 1
vidéo numérique
© D. Présent
CIF (Common Intermediate Format)
Normes H261 et H263 (International Union for Telecommunication).
• Standard de codage des signaux vidéo pour des services audiovisuels
à Px64Kb/s
Format CIF :
• Résolution luminance de 360x288 à Fimage de 29,97Hz ;
• Format 4 :2 :0.
Format QCIF :
• Résolution luminance 180x144 à Fimage sous-multiple de 29,94Hz ;
IUT Marne la Vallée
vidéo numérique
© D. Présent
6
Formats MPEG
Le groupe de l’ISO dénommé MPEG (Moving Pictures Experts Group) à
conduit à 2 normes :
• ISO 11172 (1993)pour le codage et la transmission des signaux audiovidéo pour un stockage sur des supports à environ 1,5Mb/s :
! ISO 11172-1 définit la structure du multiplexage des signaux ;
! ISO 11172-2 définit le codage vidéo MPEG-1 ;
! ISO 11172-3 définit le codage audio MPEG-1.
• ISO 13818 (1995) pour le codage et la transmission des signaux audiovidéo pour la diffusion par satellite, câble ou réseau terrestre :
! ISO 13818-1 définit la structure du multiplexage ;
! ISO 13818-2 définit les résolutions et le codage vidéo MPEG-2 ;
! ISO 13818-3 définit le codage audio MPEG-2.
IUT Marne la Vallée
vidéo numérique
© D. Présent
Traitement d’une image vidéo MPEG
IUT Marne la Vallée
vidéo numérique
© D. Présent
7
Compression MPEG
séquence
groupe d ’images
image
Macrobloc
(4 blocs)
tranche
bloc
(8x8 pixels)
1 image est composée de « n tranches »
1 tranche contient « p macroblocs »
IUT Marne la Vallée
vidéo numérique
© D. Présent
Compression MPEG-1
Construction d ’une image :
• Bloc constitué de 8 x 8 pixels ;
• Macrobloc regroupe 2 x 2 blocs (soit 16 x 16 pixels) ;
• Tranche ensemble de macroblocs (le plus souvent une ligne de
l’image) ;
• Image composée de l’ensemble des lignes de l’écran, est de l’un des 3
types :
! I (Intraframe) codée sans référence à aucune autre image ;
! P (Predicted) codée par rapport à l’image « I » ou « P »
précédente ;
! B (Bidirectionnal interpolation) codée à partir des images « I » ou
« P » et « P » qui l’encadrent ;
• Groupe d’images (Group Of Pictures) regroupe les images codées à
partir d’une même image « I ».
Groupe d’images : défini par 2 paramètres :
• M distance (en nombre d’images) entre 2 images « P » successives ;
• G distance entre 2 images « I » successives.
Le format MPEG-1 utilise un groupe d’images en (3 ;12).
IUT Marne la Vallée
vidéo numérique
© D. Présent
8
Image - Macroblocs - Blocs
Le macrobloc constitue l’unité de surface d’une image,
quelque soit le format utilisé.
Format 4:2:2
Format 4:2:0
luminance
Chrominance Cr
Chrominance Cb
2x2 blocs
« chrominance » par
macrobloc « luminance »
IUT Marne la Vallée
2x2 blocs
« chrominance » par
macrobloc « luminance »
vidéo numérique
© D. Présent
MPEG-2 : le vecteur mouvement
P
P
I
Vecteur mouvement
macrobloc
zone
d ’analyse
Recherche du macrobloc le
plus proche
• une image P est caractérisée par un vecteur mouvement et les différences
des macroblocs des images I et P
IUT Marne la Vallée
vidéo numérique
© D. Présent
9
Estimation de mouvement en MPEG-2
• calcul sur 1 bloc du signal luminance ;
• appliqué aux 4 blocs du macrobloc ;
• appliqué au signaux R-Y et B-Y ;
• si incalculable, bloc codé en image I ;
• vecteur mouvement codé sur 12 bits ;
• un décodeur dispose en permanence de 4 images en mémoire ;
• un codeur dispose en permanence de 8 images en mémoire ;
• un décodeur est paramétré pour un profil donné ;
IUT Marne la Vallée
vidéo numérique
© D. Présent
Compression MPEG : le GOP
groupe d ’images
I
B
B
P
B
B
I
Un groupe d’images (GOP) est défini par 2 valeurs :
• le nb d’images séparant 2 images I ;
• le nb d’images séparant 2 images P ou une image P et une image I ;
Exemple ci-dessus (6 ; 3)
Groupe d’images (8 ; 2)
groupe d ’images
I
IUT Marne la Vallée
B
P
B
P
vidéo numérique
B
P
B
I
© D. Présent
10
Compression MPEG : le GOP
groupe d ’images
I
B
B
P
B
B
I
• l’image P est codée par différence avec l’image I (ou P) qui la précède ;
• l’image B est codée par rapport à l’image I (ou P) qui la précède et
l’image P (ou I) qui la suit
Stockage : dans l’ordre d’arrivée
Codage :
I B B P B B I
Transmission :
I P B B I B B
Stockage/Décodage :
I P B B I B B
Ré-ordonnancement :
IUT Marne la Vallée
vidéo numérique
I B B P B B I
© D. Présent
Codec MPEG-2
IUT Marne la Vallée
vidéo numérique
© D. Présent
11
Profils MPEG-2
La norme permet la définition de la résolution de l’image à
partir de 5 profils et 4 niveaux
100
90
80
70
60
50
40
30
20
10
0
low 352x240x30
TV
high-1440 1440x1080x30
high 1920x1080x30
TVHD
high-1440 1440x1080x30
IUT Marne la Vallée
low 352x240x30
hi
gh
m
pl
e
SN
m
R
ai
n
sc
sp
a
at
la
bl
ia
e
ly
sc
a.
..
profils
1/4 TV
main 720x480x30
si
débits 'Mb/s)
niveaux
Simple : sans image B
Main : codage 4:2:0
SNR scalable : main + train d’info
Spatial scalable : codage TVHD
High : codage 4:2:2
vidéo numérique
© D. Présent
Profils MPEG-2 : options
profils
simple
main
snr
spatial
high
Images
I, P
I, P, B
I, P, B
I, P, B
I, P, B
Formats
4:2:0
4:2:0
4:2:0
4:2:0
4:2:2
High
High
1440
Main
720
576
30
15
Low
IUT Marne la Vallée
1920
1152
60
80
1440
1152
60
60
720
576
30
15
352
288
30
4
1440
1152
60
60
720
576
30
15
352
288
30
4
vidéo numérique
1440
1152
60
100
1440
1152
60
80
720
576
30
15
Éch/ligne
Lignes
Images/s
Mb/s
Éch/ligne
Lignes
Images/s
Mb/s
Éch/ligne
Lignes
Images/s
Mb/s
Éch/ligne
Lignes
Images/s
Mb/s
© D. Présent
12
Standards audio numériques
• Production :
Fe = 48KHz - 16 bits à 24 bits en mono, stéréo ou multicanal
D = 768Kb/s à 3,84Mb/s
• Diffusion :
Fe = 32KHz - 14 bits à 16 bits en mono ou stéréo
D = 896Kb/s
• Téléphone :
Fe = 8KHz - 12 bits en mono
D = 96Kb/
• Compact Disc :
Fe = 44,1KHz - 16 bits en stéréo
D = 1,4Mb/s
• AES :
Débit : Fe x N x nb canaux
Fe = 48KHz – 20 bits
D = 3,1Mb/s
IUT Marne la Vallée
vidéo numérique
© D. Présent
Techniques de compression audio
• Parole G711 (1972) : compression 1:1,5
• diffusion NICAM (1980) : compression 1:1,2
• transmission G722 (1986) MICDA : compression 1:3
• grand public Mini Disc Sony codage ATRAC : compression 1:5
• générique MPEG-1 (1992) : compression 1:6 à 1:12
• multicanaux Dolby AC3 (1994) : compression 1:6 à 1:12
IUT Marne la Vallée
vidéo numérique
© D. Présent
13
Compression audio MPEG-1 : 3 couches
Couche 1 : Compression 1:4
Débit en mono de 192Kb/s
Débit en stéréo de 384Kb/s
Application : Multimédia
Couche 2 : Compression 1:6
Débit en mono de 128Kb/s
Débit en stéréo de 256Kb/s
Application : diffusion
Couche 3 : Compression 1:12
Débit en mono de 64Kb/s
Débit en stéréo de 128Kb/s
Application : multimédia Internet
IUT Marne la Vallée
vidéo numérique
© D. Présent
Compression audio MPEG
Le codage/compression du signal audio utilise :
• Un modèle psycho-acoustique à masque variable ;
• Un banc de 32 filtres dits polyphase ;
• Echantillonnage à 32KHz, 44,1KHz, 48KHz ;
• Quantification du masquage sur une trame de 12x32 échantillons ;
• Quantification sur 16 bits avec facteur d’échelle ;
• Codage multicanal en MPEG-2 (Left, Center, Right, Left Suround,
Right Suround).
32 sous-bandes
IUT Marne la Vallée
vidéo numérique
© D. Présent
14
Codage audio MPEG
128
lo
n
s
96
64
ha
n
til
Facteur d ’échelle : 48
32
Facteur d ’échelle : 16
12
éc
0
IUT Marne la Vallée
vidéo numérique
© D. Présent
Compression audio MPEG : Codec
L0
R0
gauche
centre
droite
matrice T3
Suround G
Suround D
T4
T5
Codeur
MPEG-1
Codeur
MPEG-2
+
• algorithme de codage MUSICAM pour les radio (DAB) et télévision (DVB)
numériques
• débits de 32Kb/s à 192Kb/s par voie (Hi-Fi à partir de 128Kb/s par voie)
• un codage par DCT permet d ’obtenir la qualité Hi-Fi dès 64Kb/s
IUT Marne la Vallée
vidéo numérique
© D. Présent
15
Compression audio MPEG : trames
Trame audio couche 1
en-tête CRC résolution
32
16
Fact Ech
32 * 4
12x32 échantillons
6
Données
auxiliaires
(bits)
• 384 échantillons par trame
• durée (t) du signal audio codé 384/Fe (8ms à 48KHz)
• nombre de bits pour un débit D est D * t (1536 bits pour D=192Kb/s)
Trame audio couche 2
en-tête CRC résolution Info FE FE 3(12x32 échantillons)
32
16
32 * 4
2
6
Données
auxiliaires
(bits)
• 1152 échantillons par trame
• durée (t) du signal audio codé 1152/Fe (24ms à 48KHz)
• nombre de bits pour un débit D est D * t (3072 bits pour D=128Kb/s)
IUT Marne la Vallée
vidéo numérique
© D. Présent
Multiplexage MPEG-1
Le multiplexage permet d’assurer la transmission des signaux audio/vidéo
vers les unités de stockage.
Le multiplexeur :
• Reçoit du CODEC les trains élémentaires de données (Elementary
Streams) ;
• Découpe les trains élémentaires (ES) en paquets (Packetized
Elementary Stream) ;
• Regroupe les paquets en packs dont l’en-tête contient les
informations de temps et de débits.
Chaque pack contient :
• 0 à 16 paquets vidéo ;
• 0 à 32 paquets audio ;
• 0 à 2 paquets de données privées.
Pack 2
Pack 1
En-tête En-tête
Dernier Code En-tête
de pack système 1er paquet paquets suivants paquet de fin de pack
IUT Marne la Vallée
vidéo numérique
© D. Présent
16
Multiplexage MPEG-2
•
•
•
Pour le stockage des données audio/vidéo, la norme MPEG-2 reprend
le multiplexage de la norme MPEG-1.
La norme prévoit un flux de transport (Transport Stream) pour la
transmission sur les média des programmes destinés à la diffusion.
Le multiplexeur :
• Découpe les flux élémentaires (ES) en paquets de 188 octets ;
• constitue des trains de données pouvant combiner plusieurs
programmes.
Paquet de flux élémentaires
E-T
ES
E-T
ES
184 octets
E-T
E-T
E-T
Autre flux E-T
188 octets
E-T En-tête de paquet transport
IUT Marne la Vallée
vidéo numérique
© D. Présent
Image MPEG-4
Objet 1
codec
codage
descriptif
Analyse
de
l ’image fond
codage
descriptif
codage
m
u
l
t
i
p
l
e
x
a
g
e
ES
descriptif
Objet 2
Elementary Streams : flux élémentaires
IUT Marne la Vallée
vidéo numérique
© D. Présent
17
MPEG-4 : maillage des objets
Plus le maillage est fin, plus la forme est précise, plus les calculs sont nombreux
IUT Marne la Vallée
vidéo numérique
© D. Présent
Les standards informatiques
•
Quick Time :
– comprend essentiellement des formats de données standardisés, des
procédés de compression et de décompression, et une interface utilisateur
spécifique.
– L'extension système utilisée est fondée sur le principe du maintien de
l'isochronie des données, et introduit donc le temps comme élément
principal du système d'exploitation.
•
Vidéo pour Windows :
– ensemble logiciel permettant la capture et la restitution de vidéo animée
sur PC. L'exécution de séquences vidéo est possible sans matériel
spécifique, alors que la capture doit être faite au moyen d'une carte de
numérisation.
– offre des API (interfaces de programmation) relativement indépendantes
du matériel.
– utilise des algorithmes de compression propriétaires (Microsoft Vidéo 1,
Microsoft RLE compressor), mais intègre ceux proposés par des sociétés
tierces, comme Indeo d'Intel
IUT Marne la Vallée
vidéo numérique
© D. Présent
18
La vidéo sur Internet
le réseau Internet n'est pas approprié au transport de vidéo temps réel :
• Le réseau doit fournir suffisamment de bande passante.
• La bande passante n ’est pas garantie durant toute la
communication. Il faut prévoir des mécanismes qui assureront la
réservation de bande passante pour les applications temps réel.
• Les paquets sont routés indépendamments les uns des autres. Leur
séquencement n ’est pas assuré (ordre, espacement). Les protocoles
de transport utilisés doivent assurer les exigences temporelles que
demande la vidéo temps réel comme la synchronisation.
IUT Marne la Vallée
vidéo numérique
© D. Présent
Les protocoles temps réel
•
RSVP (Ressource ReSerVation Protocol) :
• utilisé par les applications temps réel pour réserver les ressources
nécessaires au niveau des routeurs situés le long du chemin de
transmission
• Un Contrôle de Police (Policy Control) détermine si l'utilisateur à la
permission administrative de faire de la réservation. Le contrôle
d'admission (Admission Control) détermine si le nœud à suffisamment de
ressource pour fournir la QoS demandée.
•
RTP (Real-time Transport Protocol)
– assure la reconstruction temporelle, la détection de perte, la sécurité et
l'identification du contenu.
– travaille avec le protocole RTCP pour obtenir des feed-back concernant la
qualité de la transmission
– fournit un système d'horloge (timestamping), une numérotation des
séquences et d'autres mécanismes pour prendre garde aux problèmes liés
au temps.
– RTP tourne au-dessus de UDP
En-tête IP En-tête UDP En-tête RTP Données vidéo temps-réel
IUT Marne la Vallée
vidéo numérique
© D. Présent
19
Les protocoles temps réel
RTCP (Real-Time Control Protocol)
– périodiquement des paquets RTCP pour donner des informations
sur la qualité du service délivré. travaille avec RTP. Les
participants envoient
– RTCP offre les services suivants : Contrôle de la congestion et
monitoring de la QoS ; Identification de la source ;
Synchronisation inter-média ; Information de contrôle
RTSP (Real-Time Streaming Protocol)
– initie et commande à distance des flux multimédia stockés sur un
serveur de données à travers un réseau IP.
– offre des fonctionnalités comme l'arrêt, l'avance rapide, la
recherche avancée pour des flux vidéo et audio.
– Les données quant à elles sont transmises séparément en utilisant
le plus souvent RTP.
IUT Marne la Vallée
vidéo numérique
© D. Présent
Session multimédia « temps réel »
des
Serveur « temps réel » 1-réservation
ressources dans les
routeurs à l ’établissement
Application
de la session
«temps réel»
2-transmission des données
dans des paquets RTP
RTP
RTCP
3-contrôle de la qualité de
la session (débit, gigue,
UDP
perte) par des paquets
RTCP
Routeur
RSVP
Client
Application
«temps réel»
RTP
RTCP RSVP
UDP
Routeur
RSVP
Routeur
RSVP
IUT Marne la Vallée
vidéo numérique
© D. Présent
20
off-line et streaming
1 - le fichier est chargé sur l ’ordinateur client
2 - le fichier est visionné localement
2 client
Fichiers vidéo
Routeur
serveur vidéo
off-line
Internet
1
Routeur
RTC
Modem 56Kb/s
1 - test de performance de la liaison
2 - création d ’un buffer pouvant stocker
Versions du fichier
28Kb/s 56Kb/s 512Kb/s « n secondes » de vidéo
3 - transmission des paquets
4 - visualisation « n secondes » après
l ’arrivée du premier paquet
3
Routeur
serveur
"streaming"
IUT Marne la Vallée
Internet
Routeur
4
Buffer
7Ko
2
client
RTC
Modem 56Kb/s
vidéo numérique
© D. Présent
21