Principe du codage MP3 - Votre Home Cinéma – The Next Generation

Transcription

Principe du codage MP3 - Votre Home Cinéma – The Next Generation
Principe du codage MP3
Le MP3 ou plus précisément le « MPEG 1 Audio Layer 3 » est le format de compression de données
audio le plus utilisé de nos jours. Il a été développé par le groupe MPEG (« Moving Picture Experts
Group »), spécialisé dans la compression vidéo et audio, les DVD se basent sur les travaux de ce
groupe pour compresser les vidéos avec le moins de perte de qualité possible. Le MP3 est donc un
sous-système du MPEG dédié spécialement a la compression de fichiers audio.
Voici quelques chiffre évocateurs, une chanson au format CD est échantillonnée sur 2 canaux d’une
précision de 16 Bits et cela 44 100 fois par secondes, cela correspond à 1,4 millions de Bits par
seconde. Une fois convertie en MP3 il suffira de 80 000 à 320 000 bits par seconde pour écouter la
« même » musique. Mais est ce vraiment la même ?
La compression « MPEG audio layer 3 » est dite de type destructif, cela ne signifie pas qu’elle détruit
forcement la musique, en fait, elle réduit la taille des fichiers audio en retirant certaines informations
normalement inaudibles pour des oreilles humaines.
Le codage MP3 s’effectue en trois phases :
•
Au début de la conversion le programme découpe le fichier audio en petit « paquets » de
durée égale, les chunks. La taille des chunks peut influencer sur la qualité de conversion.
•
Puis le programme analyse chaque chunk dans le domaine audible (analyse spectrométrique
par transformée de Fourier), cette opération ne produit pas de perte de qualité.
•
Ensuite, le programme utilise un profil psycho-acoustique pour supprimer les sons que l’oreille
humaine ne peut pas entendre, le choix du type de profil est déterminant pour la qualité finale.
•
Pour finir, les informations restantes sont codées dans le fichier MP3 en appliquant un
algorithme de Huffman, (algorithme de codage de type ZIP) cela permet de gagner encore
presque 20% sur la taille du fichier sans perte de qualité
Le procédé MP3 est en fait une boite a outil très polyvalente, on peu choisir de réduire la taille du
fichier au maximum afin de pouvoir le transmettre sur un réseau a faible bande passante et accepter
une qualité audio plus ou moins dégradée, ou au contraire choisir une qualité audio maximale au
détriment de la taille de fichier (c’est ce second choix que je propose dans le tutorial CDeX). Tous les
choix intermédiaires sont aussi possibles.
Les critères de sélection de ce qui est considéré comme « inutile » lors de la conversion en MP3 sont
basés sur une connaissance expérimentale de l’audition humaine obtenue en a partir d’un grand
nombre de tests, ces critères varient fortement avec les réglages du programme d’encodage,.
Voici quelques explications sommaires sur les methodes permettant de supprimer certains sons qui
de devraient pas être perçus par nos oreilles et ainsi réduire la taille du fichier audio.
•
Premier critère : la sensibilité de notre oreille qui suit une courbe en fonction de la fréquence.
En gros, les infrasons (moins de 15 ou 16 H) sont inaudibles, idem pour les ultrasons (au
dessus de 15 ou 20 kHz selon votre age),
•
Second critère : les sons les plus graves et les plus aigus doivent être suffisamment puissant
pour être perceptibles la sensibilité maximale est atteinte entre 2 et 5 kHz
•
Troisième critère : l’effet de masque qui peut se résumer ainsi, un son puissant a un certaine
fréquence masque les sons plus faible ayant une fréquence proche
C’est donc la qu’interviennent un certain nombres de choix techniques et de possibilités de réglage du
programme capable de convertir la musique en MP3.
Voici pour finir quelques graphiques qui montent la répartition du débit du flux d’information
en fonction des choix que nous pouvons faire lors de l’encodage MP3
Encodage 1
F. Echantillon :44.1 kHz
Taille fichier 3.9 Mo
Débit : 128 kbs CBR
(Constant Bit Rate)
C’est un codage approprie a une transmission a débit moyen, Le son est apparemment de bonne
qualité, mais la comparaison avec le fichier d’origine met en évidence des manques d’informations
Encodage 2
F. Echantillon :44.1 kHz
Taille fichier 4.7 Mo
Debit : 160 kbs ABR
(Auto Bit Rate)
Pour conserver plus d’informations on fixe un débit moyen de 160 000 bits par seconde et le
programme utilise moins de bit lorsque le signal musical est plus simple et récupère la place gagnée
lorsque le son devient complexe. La qualité est déjà meilleure.
Encodage 3
F. Echantillon :44.1 kHz
Taille fichier : 5.7 Mo
Qualité : VBR - V2
Débit .de 128 à 320 kbs
(Variable Bit Rate)
Ici on fixe un débit minimum et maximum, il est don impossible de connaître a l’avance la taille du
fichier, Le programme fait varier le débit pour conserver un niveau de qualité minimal imposé par vos
réglage, avec la sélection VBR V2 la plupart des auditeurs ne discernent plus la MP3 de l’original.
Encodage 4
F. Echantillon :44.1 kHz
Taille fichier : 7,4 Mo
Qualité : VBR – V0
Débit .de 128 à 320 kbs
(Variable Bit Rate)
Avec la sélection VBR V0 la compression s’approche d’une qualité sans perte, en theorie d’infimes
différences a la limite du perceptible peuvent encore apparaître en de très rares occasions sur
certains enregistrements. Seul de très rares auditeurs peuvent éventuellement entendre ces petites
différences entre le MP3 et l’original a condition de disposer d’un équipement audio proche de la
perfection et des conditions d’écoutes de qualité exceptionnelles, Personnellement, j’ai des oreilles
très fines et un système audio de très haute qualité et je n’ai jamais pu mettre en évidence la moindre
petite altération sonore.
Le site Internet MusiClassics a organise il y a quelque temps un test gratuit en téléchargement. Il
s’agissait simplement d’identifier pour chacun des 4 extraits musicaux le meilleur format audio parmi
les 6 propositions (mp3 320 kbps, AAC 192 kbps et 320 kbps d’Apple, WMA 192 kbps et 320 kbps de
Microsoft, et CD).
Du simple casque relié à l’ordinateur, à la chaîne hi-fi, chaque participant a utilisé son propre
environnement et son propre rythme pour l’évaluation des différents formats. Et le résultat qui balaye
définitivement toutes les idées reçues
Après avoir récolté suffisamment de réponses pour un traitement statistique pertinent, il apparaît
qu’aucun des formats n’est clairement différentiable à l’oreille, sur 200 personnes, moins de 3% des
participants ont trouvé 3 ou 4 résultats exacts ! Les résultats du test sont donc à peu près
identiques à un jeu de pur hasard, en d’autres termes, CD, MP3, WMA, WMA (dans les niveaux de
compressions proposées) sont totalement indifférentiables à l’oreilleM
Le jeu-test est toujours disponible sur le site, jouez-y à votre tour !