MP3 : MPEG-1 Audio Layer III

Transcription

Felix HAHNLEIN & Auriane REVERDELL
Ensimag - Grenoble INP
Mars 2016
1 / 31
Table des matières
1
Introduction
2
Encodage
Filtre polyphase
MDCT
Analyse psychoacoustique
Allocation de bits
3
Performances
4
Avantages et inconvénients
2 / 31
Introduction
Introduction
Publié officiellement en 1992 par le groupe MPEG (Moving Picture
Experts Group)
Encodeur perceptuel, exploitation des défauts de l’ouı̈e humaine
Bande passante: 20Hz - 20kHz
Masquage auditif: simultané et temporel
3 / 31
Introduction
Masquage auditif
Découpage de la bande fréquentielle en bandes critiques
4 / 31
Introduction
Masquage auditif
Masquage simultané
5 / 31
Introduction
Masquage auditif
Masquage temporel
6 / 31
Encodage
Encodeur perceptuel
7 / 31
Encodage
Filtre polyphase
Filtre Polyphase
Le signal PCM est partitionné en :
Frames
32 sous-bandes de fréquences égales par frame
36 échantillons par sous bandes
Filtre passe bas → enlève les fréquences inaudibles par l’oreille humaine
8 / 31
Encodage
MDCT
Types de fenêtres
9 / 31
Encodage
MDCT
MDCT
10 / 31
Encodage
MDCT
MDCT
Fenêtrage → MDCT sur des sous-bandes utilisant un chevauchement
temporel de 50% entre des fenêtres adjacentes


x1
 .. 
 . 
 
x18 
 
x19 
 
 .. 
 . 
→
MDCT
x36
 
x19
 .. 
 . 
 
x36 

→
x37 
 
 .. 
 . 
→
MDCT
→ ···
x54
Demo video
11 / 31
Encodage
But: Calculer les rapports SMR(Signal-to-mask ratio) pour toutes les
bandes critiques.
12 / 31
Encodage
Calcul des énergies, mesures d’imprévisibilité par bande
Energie par
Pbhbande
z
eb(z) = f =bl
R 2 (f )
z
devient
13 / 31
Encodage
Calcul des énergies, mesures d’imprévisibilité par bande
Mésure d’imprévisibilité
cw (f ) = G (R(f ), Φ(f ))
Ici, les basses fréquences ont une probabilité plus importante d’être
des son
14 / 31
Encodage
Calcul de la fonction de propagation
Fonction de propagation
exprime l’influence d’une bande critique z sur les autres
Convolution avec l’énergie et l’imprévisibilité
⇒ pondération de ces fonctions
15 / 31
Encodage
Estimation de l’indice de tonalité
L’opposée de l’imprévisibilité par bande
16 / 31
Encodage
Calcul du seuil de masquage
Un son a une plus grande aptitude a masquer un bruit qu’un bruit un
son.
Noise-masking-tone
Tone-masking-noise
17 / 31
Encodage
Calcul du seuil de masquage
Comment choisir le comportement? On interpole entre les deux
comportements extrêmes grâce à notre probabilité d’être un son.
SMR(z) = 24Pson (z) + 4(1 − Pson (z))
18 / 31
Encodage
Entropie perceptuelle
Il s’agit d’une borne inférieure du nombre de bits nécessaires pour
encoder un échantillon sans introduire une différence perceptuelle par
rapport à l’original.
PE = −
X
z∈{bandesCritiques}
largeur (z) log(
seuilDeMasquage(z)
)
energieDeBande(z)
A quels moments va-t-elle dépasser un certain seuil?
19 / 31
Encodage
Détection des passages rapides
Situation d’un écho, p.ex. déclenché par un triangle
20 / 31
Encodage
Détection des passages rapides
Eviter des ”pré-échos”, dus au bruit de quantification
Emettre un signal au module MDCT, pour augmenter la résolution
fréquentielle.
21 / 31
Encodage
Allocation de bits
Allocation de bits
Système de boucles :
Distortion control loop : vérifie bruit quantification < seuil de
masquage
Rate control loop : pas de quantification, tables de Huffman
22 / 31
Encodage
Allocation de bits
Distortion control loop
23 / 31
Encodage
Allocation de bits
Variables de l’éxécution de la boucle extérieures
24 / 31
Encodage
Allocation de bits
Rate control loop : Quantification
Quantification non uniforme : ajustement du pas de quantification en
fonction des bandes
Elévation des valeurs à la puissance 3/4 → petites valeurs quantifiées
avec plus de précision
Application de la formule de quantification
25 / 31
Encodage
Allocation de bits
Rate control loop : Codage de Huffman
Codage de Huffman
32 tables de Huffman
Ordonnnancement du block codé par régions → permet de
sélectionner la table la plus adaptée (si beaucoup de zeros ou
beaucoup de grandes valeurs)
Ajustement du pas de quantification pour que la plus grande valeur
quantifiée puisse être codée avec le code de Huffman le plus large
26 / 31
Encodage
Allocation de bits
Exemples de découpages en régions
27 / 31
Performances
Encodage exemplaire
L’original: 3.5Mo, 16bit - 44,1kHz
28 / 31
Performances
Encodage exemplaire
Bit-rate: 320kBit/s - 806,7ko
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Performances
Encodage exemplaire
28 / 31
Avantages
Supporté par des nombreux types de périphériques
Standard ISO, format libre
Décodage rapide et moins complexe que celui de l’AAC
Inconvénients
Performance moins bonne que celle d’autres formats plus récents
Limite de 320kbit/s parfois pas suffisante
29 / 31
Conclusion
Conclusion
La compression MP3 est une compression avec pertes travaille par blocs de
données et quantifie le spectre avec une résolution fréquentielle adaptative.
Elle cherche à optimiser le pas de quantification en fonction des données
afin que la différence perceptuelle par rapport à l’original reste négligeable.
30 / 31
Appendix
Bibliographie
Bibliographie I
Jayaraman J.Thiagarajan, Andreas Spanias
Analysis of the MPEG-1Layer III (MP3) Algorithm Using MATLAB
2011
Rassol Raissi
The Theory Behind Mp3.
2002
31 / 31

MP3 : MPEG-1 Audio Layer III

Transcription

Documents pareils

Description L`ordinateur au centre de la musique • Brancher l

Sourate 106 : Koraïsh - Ecouter le Coran sur le

Convertir le format d`un fichier (Audio, Vidéo ou

Category -> intercom-scala-rider Câble MP3 pour

Programme de formation montage video avec adobe premier pro

Emetteur FM, LogiLink 20345 Transmetteur FM avec MP3 Player

Enregistrer un fichier audio

Comment convertir une vidéo en fichier audio afin de réaliser une

Guide pas à pas Audiograbber Convertir un CD audio en fichiers MP3