Cours : Numériser le signal audio.

Commentaires

Transcription

Cours : Numériser le signal audio.
Jean-Paul Stromboni, ESSI
le 02/03/2005
C
Coouurrss :: N
Nuum
méérriisseerr llee ssiiggnnaall aauuddiioo..
Précision :
Questions à résoudre :
Votre but est d’apprendre résoudre les questions de la liste suivante en utilisant les
informations qui leur sont attachées, à savoir :
- des liens vers les notions nécessaires documentées dans le contenu du cours
- des réponses brutes (sans explications) aux questions
- des procédures suggérées pour aboutir aux réponses attendues
1.
2.
3.
4.
5.
6.
Connaître les composants de la chaîne de numérisation
Savoir lire un chronogramme
Savoir numériser un signal audio
Choisir la fréquence d’échantillonnage
Calculer la taille d’un fichier audio
Tirer les conséquences de la contrainte de Shannon
Précision :
Contenu du cours :
L’objectif de ce chapitre consiste à introduire le concept de signal numérique et
l’opération de numérisation.
De multiples applications de la technologie moderne utilisent des sons et des images
numériques, voir les CD, DVD, appareils photos, caméscopes, téléphone, radio, les
ordinateurs, internet … d’où l’intérêt de bien cerner les tenants et les aboutissants de
l’opération de numérisation.
Pour cela, voici précisément la liste des thèmes développés :
1.
2.
3.
4.
5.
6.
Comment les ordinateurs numérisent les sons
Les différentes formes possibles du signal audio
Les paramètres de la numérisation du signal audio
Comment bien choisir la fréquence d’échantillonnage
Quel est l’impact de la longueur binaire choisie
Comment calculer débit et taille d’un son numérisé
Jean-Paul Stromboni, ESSI
THÈME 1
le 02/03/2005
COMMENT LES ORDINATEURS NUMÉRISENT LES SONS.
Les ordinateurs savent numériser un son, puis le traiter, par exemple le compresser, le
filtrer, lui ajouter des effets sonores, et enfin le jouer sur les haut-parleurs.
Pour ce faire, le son est d’abord transformé par le micro en signal audio électrique qui
est présenté à la carte son qui va le numériser avant le traitement par l’ordinateur. Le
signal traité peut être transformé en son par les haut-parleurs.
le son micro s(t) signal
électrique
signal s(t)
CAN numérisé
DSP
le son
haut- signal
parleurs bloqué
signal
CNA traité
carte son
Traitement
du signal
numérisé
microprocesseur
Définition :
son
Le son est une vibration de l’air qui se propage avec des caractéristiques variables
d’intensité, de fréquence, de portée, d’écho, ...
L’oreille humaine est sensible aux sons dans certaines limites d’intensité et de
fréquence, c’est le processus de l’audition.
Quand les cordes vocales créent des sons, c’est la voix et le processus de la phonation.
Définition :
micro
Le microphone (abréviation micro) est le capteur utilisé par l’ordinateur pour
transformer le son en signal électrique, que l’on appelle signal audio.
Le micro est ainsi un transducteur électro-acoustique.
Définition :
carte son
La carte son réalise l’interface entre l’unité centrale de l’ordinateur, le micro et les
haut-parleurs. On y trouve des bornes électriques pour échanger les signaux :
1. la borne micro reliée à l’entrée du CAN, acronyme pour Convertisseur Analogique
Numérique afin de numériser le signal électrique issu du micro.
2. la borne haut-parleur est reliée à la sortie du CNA ou Convertisseur Numérique
Analogique qui synthétise des sons audibles par blocage d’ordre zéro.
3. la borne line, qui permet d’échanger des signaux audio avec d’autres appareils
Si la carte son est amovible, on y trouve également un connecteur de bus pour les
échanges de données avec l’unité centrale. Parfois, on y trouve aussi un processeur
DSP pour traiter le signal audio directement dans la carte son.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Exemple :
carte son
Sur la carte son amovible représentée ci-dessous, on peut repérer à droite les bornes
électriques utilisables pour brancher micro et haut-parleurs, et le connecteur de bus en
bas. Sur la carte, on repère le CNA (en anglais DAC), le DSP, microprocesseur
spécialisé, et sans doute le CAN en bas au centre.
Trois bornes :
micro, line et
haut-parleurs
CAN
CNA
Liaison par bus avec le
microprocesseur
Définition :
CAN
Le convertisseur analogique numérique ou CAN est un circuit intégré électronique
capable de numériser le signal électrique présenté à la borne micro de la carte son.
Définition :
CNA
Le CNA (pour convertisseur numérique analogique) est un circuit intégré qui constitue
à partir d’un signal numérique un signal électrique utilisable sur la borne haut-parleur
de la carte son en utilisant la technique du bloqueur d’ordre zéro.
Définition :
haut-parleurs
Les haut-parleurs sont des transducteurs électroacoustiques capables de traduire un
signal électrique en vibration sonore de l’air, d’où un son. C’est l’inverse du micro.
Définition :
DSP
Un DSP est un microprocesseur spécialisé capable de traiter les signaux associés aux
sons plus rapidement et plus efficacement que les microprocesseurs à usage général.
DSP est l’acronyme pour Digital Signal Processor, qui signifie Processeur de Signal
Numérique. Digital est la traduction anglaise de numérique.
Jean-Paul Stromboni, ESSI
THÈME 2
le 02/03/2005
LES DIFFÉRENTES FORMES POSSIBLES DU SIGNAL AUDIO.
Les propriétés du signal audio électrique issu du microphone subissent plusieurs
transformations dans la carte son. C’est au départ un signal continu et un signal
analogique, avant de devenir un signal discret et surtout un signal numérique.
Définition :
signal audio
Un signal habituellement est une fonction du temps créée par un capteur pour mesurer
une grandeur physique.
Le signal audio est un cas particulier de signal qui traduit la mesure d’un son.
Présenté à l’entrée du CAN, ce signal issu du micro est en réalité une tension
électrique qui reproduit les vibrations de l’air. Cette tension est proportionnelle à tout
instant à la pression de l’air mesure donc l’intensité instantanée du son.
On la représente aisément dans un chronogramme.
Formalisation :
signal audio
On note s(t) l’intensité ou valeur instantanée du signal audio, en Volt à la sortie du
micro et à l’entrée des haut-parleurs, t est le temps exprimé en seconde (s).
Précision :
signal audio
L’intervalle des valeurs permises au signal audio s (t ) reste limité à IVP = [−1,1] ,
c'est-à-dire que s (t ) ∈ [−1,1], ∀t ou encore que − 1 ≤ s (t ) ≤ 1, ∀t .
Définition :
chronogramme
Quand on représente au cours du temps un signal audio, avec le temps en abscisse et
l’intensité en ordonnée, on obtient un chronogramme.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Exemple :
chronogramme, signal audio, Goldwave
Le chronogramme d’un signal audio est tracé ici par Goldwave.
On peut y lire la durée ≈ 9,5 sec et l’ordre de grandeur de l’intensité ≈ 10% .
Définition :
signal sinusoïdal
Un signal sinusoïdal est un signal dont l’intensité prend la forme suivante :
s (t ) = a cos(2πf 0t + φ ) ou s (t ) = sin( 2πf 0t + φ ) ,
où a est l’amplitude, φ la phase ou déphasage, et f 0 la fréquence.
Précision :
signal sinusoïdal
On appelle note pure un signal audio sinusoïdal, c’est la note de musique la plus
simple. Ainsi, la tonalité téléphonique est une note pure LA3 de fréquence 440 Hz que
tout un chacun peut entendre avant de composer un numéro de téléphone.
Exemple :
signal continu, signal sinusoïdal, signal analogique,
Le chronogramme suivant est tracé par la fonction plot(.) de Matlab à partir de
l’expression mathématique du signal s (t ) = 0.9 cos(2π 440t ) .
C’est le chronogramme d’un signal sinusoïdal, analogique et continu.
Sur le chronogramme, on propose de s’exercer à retrouver :
1. 5 périodes du signal, et une durée d’environ 11ms,
2. la période ≈ 2,2ms du signal et sa fréquence ≈ 440 Hz ,
3. l’amplitude : 0.9 de la sinusoïde.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Définition :
signal analogique
Un signal audio est analogique quand l’intensité peut prendre toute valeur dans
l’intervalle IVP des valeurs permises soit [−1,1] , c’est le cas du signal issu du micro.
Définition :
signal continu
Un signal est continu (abréviation de « à temps continu») quand on peut mesurer son
intensité à tout instant de l’enregistrement, c’est le cas du signal issu du micro.
Définition :
signal discret
Un signal discret (à temps discret) est une suite de valeurs mesurées périodiquement
sur un signal continu, son intensité n’est connue qu’aux instants de mesure.
Exemple :
signal discret
Le signal suivant est constitué de ≈ 100 mesures représentées en rouge et opérées sur
un signal continu qui est indiqué par un trait pointillé bleu.
Définition :
signal numérique
Un signal numérique possède une intensité quantifiée qui ne peut prendre qu’un
nombre fini de valeurs différentes dans l’intervalle des valeurs permises IVP = [− 1,1].
Exemple :
signal numérique
Le signal ci-dessous (en rouge) est numérique dans la mesure où on peut vérifier qu’il
ne sait prendre que 8 valeurs différentes sur la figure.
On complétera ces valeurs : 0,0.25,0.5,0.75,... .
Jean-Paul Stromboni, ESSI
le 02/03/2005
Définition :
Matlab
MATLAB (ou Matrix Laboratory) est un logiciel de calcul et de simulation basé sur le
calcul matriciel et utilisé dans le domaine du Traitement du Signal et des Images, et
dans de nombreux domaines scientifiques et techniques.
Il sera utilisé dans la suite de ce cours pour analyser, traiter et représenter les sons
numériques, ce qui donnera l’occasion d’apprendre à s’en servir.
Quand on parle de Matlab, il peut être intéressant de connaître l’existence de Scilab
proche de MATLAB, et pourtant gratuit, créé et développé par l’INRIA Rocquencourt.
Définition :
Goldwave
Goldwave est un shareware qui peut être utilisé en Travaux Pratiques pour enregistrer,
observer et traiter les sons numériques, la version d’évaluation est accessible sur le site
www.goldwave.com.
Définition :
bloqueur d’ordre zéro
Un bloqueur d’ordre zéro constitue un signal continu c'est-à-dire qui dure dans le
temps en partant d’une suite de valeurs instantanées arrivant à intervalles de temps
réguliers.
Le principe est de maintenir la dernière valeur arrivée jusqu’à l’arrivée de la valeur
suivante, il en résulte un signal constant par morceaux que l’on appelle signal bloqué.
Blocage d’Ordre Zéro (ou BOZ) se dit Zero Order Hold (ZOH) en anglais.
Exemple :
bloqueur d’ordre zéro, signal bloqué
Le chronogramme créé ci-dessous avec la fonction stairs(.) de MATLAB met en
évidence l’aspect caractéristique d’un signal bloqué, ou créé par blocage d’ordre zéro,
c'est-à-dire constant par morceaux. On vérifie qu’il s’agit d’un signal à temps continu.
Jean-Paul Stromboni, ESSI
THÈME 3
le 02/03/2005
LES PARAMÈTRES DE LA NUMÉRISATION DU SIGNAL AUDIO
Pour numériser un signal audio, il faut choisir une fréquence d’échantillonnage et
fixer une longueur binaire ou nombre de bit pour coder chaque échantillon.
Définition :
numériser
La numérisation d’un signal audio consiste en pratique à le découper doublement :
1/ d’abord selon l’axe des temps, et on nomme échantillonnage ce découpage et
période d’échantillonnage l’épaisseur des tranches de temps
2/ ensuite, selon l’axe des intensités, et on nomme quantification ce découpage dont la
finesse des tranches est le pas de quantification.
Définition :
échantillonnage
L’échantillonnage du signal audio est la mesure périodique de son intensité, au rythme
de la période d’échantillonnage.
On nomme échantillons les valeurs mesurées aux instants d’échantillonnage.
Exemple :
échantillonnage
Le CAN ou Convertisseur Analogique Numérique est le circuit intégré électronique de
la carte son qui mesure l’intensité du signal audio du micro au rythme d’une période
d’échantillonnage, et qui le code en binaire dans des mots de longueur binaire donnée.
Formalisation :
échantillonnage
Les instants d’échantillonnage sont les instants t n = nTe , avec n entier.
Les échantillons sont les valeurs de s (t ) aux instants d’échantillonnage.
s (nTe ) = s (t ) t = nTe .
On peut les déterminer (1) sur le chronogramme et (2) à partir de l’expression s (t ) .
Définition :
période d’échantillonnage.
La période d’échantillonnage est le laps de temps qui sépare deux échantillons
successifs. On note Te la période d’échantillonnage qui s’exprime en seconde (s).
Jean-Paul Stromboni, ESSI
le 02/03/2005
Définition :
fréquence d’échantillonnage.
La fréquence d’échantillonnage est le nombre d’échantillons mesurés par seconde,
c’est donc exactement l’inverse de la période d’échantillonnage.
On note f e la fréquence d’échantillonnage qui s’exprime en Hertz (Hz) : f e = 1 / Te .
Exemple :
fréquence d’échantillonnage.
On rencontre couramment les valeurs suivantes pour la fréquence d’échantillonnage :
f e = 8000 Hz (pour le téléphone) et f e = 44100 Hz (pour les CD audio).
Définition :
quantification
On dénomme quantification l’effet produit sur l’intensité du signal audio par le codage
en binaire de chaque échantillon avec une longueur binaire fixée.
C’est un effet non linéaire, car l’intensité du signal codé ne peut prendre qu’un nombre
limité de valeurs séparées par un ou plusieurs pas de quantification .
Définition :
longueur binaire
C'est le nombre de bits utilisés pour coder en binaire chaque échantillon.
Si B est la longueur binaire des échantillons, on dispose seulement de 2 B codes
binaires différents pour coder l’intensité des échantillons, laquelle peut pourtant
prendre toutes les valeurs de l’intervalle IVP = [−1,1] .
Exemple :
longueur binaire
Ainsi, une longueur binaire B = 8bit donne 256 codes différents, pas un de plus !
Une longueur binaire B = 16 autorise 65536 valeurs binaires différentes, …
Définition :
pas de quantification
Le pas de quantification est l’écart inévitable entre deux valeurs successives possibles
pour les échantillons après codage en binaire sur B bit.
Définition :
loi de quantification
La loi de quantification indique l’intensité associée à chacun des codes binaires
possibles. Avec B bit, l’intervalle des intensités permises IVP = [−1,1] est partitionné
en 2 B sous-intervalles, et une valeur d’intensité est associée à chaque sous-intervalle.
Précision :
loi de quantification
Une loi de quantification est dite uniforme quand les 2 B pas de quantification sont de
taille identique. Pour un signal audio quantifié avec B bit, cette taille vaut alors
P = 2 / 2B .
Exemple :
loi de quantification
La loi de quantification du CAN découpe l’intervalle IVP = [−1,1] en 2 B sous
intervalles égaux notés Pi , i de 0 à 2 B − 1 .
Si on note les bornes inférieures m0 , m1 ,... m2 B −1 , la règle d’association est la suivante :
si s (nTe ) est inclus dans le pas de quantification Pi on lui associe le code i en binaire
sur B bit et la valeur d’intensité quantifiée s n = mi .
Jean-Paul Stromboni, ESSI
le 02/03/2005
La variante qui consiste à associer à s (nTe ) la valeur centrale ci du pas Pi qui le
contient, soit s n = ci et le code binaire i sur B bit, produit une erreur de
quantification s (nTe ) − s n centrée, c'est-à-dire nulle en moyenne.
Définition :
caractéristique de quantification
La caractéristique de quantification représente graphiquement la loi de quantification,
et reporte l’échantillon s (nTe ) en abscisse et la valeur quantifiée sn en ordonnée.
Exemple :
caractéristique de quantification
Voici une caractéristique de quantification de type CAN dans le cas d’une longueur
binaire valant B = 4bit
Jean-Paul Stromboni, ESSI
THÈME 4
le 02/03/2005
COMMENT BIEN CHOISIR LA FRÉQUENCE D’ÉCHANTILLONNAGE
Pour bien échantillonner, il faut absolument respecter la contrainte de Shannon.
Les échantillons contiennent alors toutes les informations nécessaires pour reconstituer
le signal avant échantillonnage.
Précision :
limites de l’audition, limites de la phonation, bande téléphonique
* l’audition humaine s’étend de 20 Hz à 20kHz (la zone la plus confortable va de
500 Hz à 10000 Hz ).
* la phonation s’étend à peu près de 50 Hz à 7 kHz .
* la bande téléphonique grand public couvre les fréquences de 300 Hz à 3300 Hz .
Définition :
contrainte de Shannon
La contrainte de Shannon consiste à borner inférieurement la fréquence
d’échantillonnage f e , en imposant une contrainte de la forme f e > 2 × f m .
On tire la fréquence f m de l’observation du spectre du signal à échantillonner. S’il
existe une fréquence au-delà de laquelle le spectre est identiquement nul, c’est f m .
Précision :
contrainte de Shannon
La contrainte de Shannon découle de la formule de Shannon.
Cette formule peut calculer un signal à partir des seuls échantillons prélevés sur ce
signal, si et seulement si la contrainte de Shannon est vérifiée.
Si par contre f e ≤ 2 × f m , il est impossible de retrouver le signal avec les échantillons.
Contrainte appliquée en pratique :
En pratique, on ajoute une marge de sécurité sur la contrainte de Shannon. On fixe une
fréquence d’échantillonnage pouvant aller de f e = 2,2 f 0 jusqu’à f e = 4 f 0 .
Au-delà, on augmenterait inutilement le nombre de mesures par unité de temps
Exemple :
contrainte de Shannon
Pour échantillonner le signal sinusoïdal s (t ) = 0.5 cos(2000πt ) , la contrainte de
Shannon impose une fréquence d’échantillonnage de f e > 2000 Hz .
Pour échantillonner le signal s (t ) = 0.25 cos(2000πt ) + sin(6000πt ) , l’application de la
contrainte de Shannon donne une fréquence d’échantillonnage f e > 6000 Hz .
Exemple :
non respect de la contrainte de Shannon
Voici un cas où on peut montrer que la contrainte de Shannon n’est pas respectée.
Les échantillons (en rouge) restent égaux à 0.5 alors que le signal (en bleu) est
sinusoïdal de fréquence 880Hz, la fréquence d’échantillonnage vaut f e = 880 Hz .
Il est impossible de reconstruire le signal à partir des échantillons et f e devrait être
multipliée par deux au moins pour respecter la contrainte de Shannon.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Définition :
spectre
Le spectre du signal s (t ) est une fonction S ( f ) de la fréquence f . Le spectre donne
la composition fréquentielle du signal.
Tout signal possède un spectre S ( f ) que l’on peut calculer avec la transformée de
Fourier que l’on notera : S ( f ) = TF [ s (t )] .
Le spectre S ( f ) contient exactement la même information que le signal s (t ) .
Exemple :
spectre
Un signal sinusoïdal de fréquence f 0 , par exemple s (t ) = a cos(2πf 0 t ) possède un
spectre simple réduit à une composante non nulle (ou raie) située à la fréquence f 0 .
Un signal obtenu en faisant la somme de signaux sinusoïdaux de plusieurs fréquences,
aura un spectre composé de raies, avec une raie pour chacune de ces fréquences.
Précision :
transformée de Fourier
La transformation de Fourier permet de passer de façon bijective d’un signal à son
spectre et réciproquement, ce qui implique que s (t ) et S ( f ) sont équivalentes:
s (t ) ⎯
⎯→ S ( f ) =
−1
S ( f ) ⎯TF
⎯
⎯→ s (t ) =
∫
+∞
−∞
∫
+∞
−∞
s ( t ) e − 2 i π ft dt
S ( f )e 2iπft df
L’adaptation de la transformée de Fourier aux signaux discrets et numériques donne la
transformée de Fourier discrète TFD et la transformée de Fourier rapide ou FFT
Jean-Paul Stromboni, ESSI
THÈME 5
le 02/03/2005
QUEL EST L’IMPACT DE LA LONGUEUR BINAIRE CHOISIE
Quand la longueur binaire de chaque échantillon augmente, la taille du signal
numérique croît proportionnellement, et le pas de quantification décroît de même que
l’erreur de quantification. La qualité de la numérisation qui croît avec la longueur
binaire des échantillons, est mesurée par le rapport signal sur bruit (ou SNR)
Précision :
Si la taille du signal numérique est proportionnelle à la longueur binaire B , le pas de
quantification 2 / 2 B (loi de quantification uniforme) y est inversement proportionnel.
Définition :
erreur de quantification
L’échantillon s (nTe ) étant codé en binaire dans la valeur s n par le CAN, l’erreur de
quantification est définie par e(nTe ) = s (nTe ) − s n , la valeur de l’intensité mesurée
moins la valeur quantifiée.
Exemple :
erreur de quantification
Avec l’exemple d’un CAN opérant sur B bits, l’erreur de quantification est positive et
reste limitée par le pas de quantification, soit 0 < s(nTe ) − sn < 2 / 2 B . On le voit
aisément sur la caractéristique de quantification.
Si par contre on associe à un code bianire la valeur centrale du pas de quantification,
l’erreur de quantification reste comprise entre − 1 / 2 B et 1 / 2 B .
Précision :
erreur de quantification
En pratique, il est impossible de traiter l’erreur de manière déterministe, car on ne sait
pas prédire e(nTe ) = s(nTe ) − s n . On préfère analyser l’incertitude de quantification, et
évaluer plutôt les limites et les propriétés statistiques de l’erreur.
L’hypothèse la plus simple est que les valeurs possibles de l’erreur de quantification
sont équiprobables, réparties uniformément entre les bornes de l’erreur, la moyenne de
l’erreur est alors la demi somme des bornes, et on sait calculer aussi simplement
l’écart type de l’erreur, c'est-à-dire la valeur moyenne de l’écart à la valeur moyenne.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Définition :
rapport signal sur bruit
Une erreur de quantification e(nTe ) est d’autant plus pénalisante que l’intensité du
signal audio est faible. Le rapport s (nTe ) / e(nTe ) donne la précision et la qualité de la
quantification. C’est un indicateur de la qualité de la quantification.
Cet indicateur conduit à la notion de rapport signal sur bruit (ou SNR pour Signal to
Noise Ratio) défini comme suit et exprimé en général en décibel (dB) :
écart type signal
SNR =
écart type erreur
Exemple :
rapport signal sur bruit
Un SNR de 72dB est donné comme un excellent rapport signal sur bruit sur une ligne
téléphonique grand public, le bruit de quantification y est quasiment inaudible.
Précision :
décibel
On définit le décibel (dB) pour a > 0 seulement ! C’est a dB = 20 log10 (a ) .
THÈME 6
COMMENT CALCULER DÉBIT ET TAILLE D’UN SON NUMÉRIQUE
Le débit et la taille d’un son numérisé croissent proportionnellement à la fréquence
d’échantillonnage f e et à la longueur binaire des échantillons B et décroissent par
contre proportionnellement au taux de compression.
Définition :
débit d’un son numérisé
Le débit associé à un son numérisé est le nombre de bits créés chaque seconde par
l’opération de numérisation, c’est aussi le nombre de bits à télécharger par seconde
pour jouer le son sans ralentir . Le débit s’exprime en bit par seconde (bps).
Précision :
débit
Un son numérisé en monophonie avec f e échantillons de B bit chaque seconde
provoque un débit de numérisation de f e × B bps (bit par seconde).
En cas de stéréophonie, on utilise deux haut-parleurs pour recréer l’information de
position des sources sonores, il faut doubler le débit par rapport à la monophonie.
Définition :
taille d’un son numérisé
Si on numérise T seconde de signal audio, la taille mémoire nécessaire (en bit) pour
stocker le son numérique, est le produit du débit (en bps) par la durée en seconde, soit
f e × B × T bits en monophonie, il faut doubler ce résultat en stéréophonie.
Précision :
taille
La taille d’un son numérique s’exprime en bit ou en octet (un octet égale 8 bit), mais
aussi en kilo-octet (ko), ou en mégaoctet. Attention ! Un kilo-octet égale 1024 = 210
octets et non pas 1000 octets !
Définition :
taux de compression
Pour télécharger aisément un fichier son numérique, on le compresse en utilisant un
CODEC.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Le taux de compression peut être calculé indifféremment en faisant le rapport des
tailles ou le rapport des débits du son avant compression et du son compressé.
Ainsi, si on applique un taux de compression C à un son numérique,
f × B ×T
bit
- sa taille est divisée par C et devient e
C
f ×B
bps
- et son débit est divisé par C et devient e
C
Définition :
CODEC
Un CODEC (pour COder DECoder) est un traitement logiciel utilisé pour appliquer un
taux de compression à un fichier audio (on dit aussi coder), et ensuite pour
décompresser (ou décoder) le fichier compressé.
Exemple :
CODEC
On parle par exemple et pour les sons numériques de CODEC mp3, ou de CODEC
µ−law ou A-law, ou encore de CODEC ogg, ou de mpc, selon le principe de
compression appliqué à un son.
Il existe aussi des CODEC adaptés aux images, tels jpeg, et aux vidéos, tels mpg
Précision :
CODEC
Les formats des fichiers audio sont multiples, qui seront évoqués dans ce cours :
- Le format PCM (Pulse Coded Modulation) est non compressé, on y trouve un entête indiquant les paramètres de numérisation et tous les échantillons
- Le format MP3 (MPEG audio layer 3) est compressé avec des taux variables de
l’ordre de C = 10 , mais la compression détermine une modification du signal
- Le format AU est compressé avec la loi mu avec un taux plus faible d’au plus
C = 2 mais sans modification du signal
- L’extension wav sur un fichier audio numérique peut recouvrir plusieurs formats,
dont PCM.
Précision :
qualité téléphonique et qualité CD
Parler de qualité de numérisation équivaut à donner les paramètres de numérisation,
que sont fréquence d’échantillonnage, longueur binaire, débit, mono/stéréophonie :
- Qualité téléphonique signifie : monophonie (un seul canal sonore), f e = 8000 Hz ,
B = 8bit , donc aussi un débit de 64kbps
- Qualité CD signifie : stéréophonie (deux canaux sonores), B = 16bit par canal, et
f e = 44100 Hz
Jean-Paul Stromboni, ESSI
Question 1 :
le 02/03/2005
DÉCRIRE LES COMPOSANTS DE LA CHAÎNE DE
NUMÉRISATION
L’ordinateur multimédia est capable d’enregistrer des sons, et de créer des sons.
On demande de retrouver la fonction de chacun des composants cités ci-dessous :
1. le micro
2. le CAN
3. le CNA et le bloqueur d’ordre zéro
4. les haut-parleurs
5. la carte son
Exemple :
Réponses
1. le micro traduit le son en signal audio électrique
2. le CAN numérise le signal du micro
3. CNA crée un signal électrique pour le haut parleur et le blocage d’ordre zéro le
fait durer dans le temps et crée ainsi un son audible
4. les haut-parleurs transforment en son le signal électrique issu du CNA
5. la carte son fait l’interface entre le signal électrique du micro, l’unité centrale de
l’ordinateur et les haut-parleurs
Précision :
étapes de résolution
Pour répondre, on suggère de consulter le cours, en particulier les notions de carte son,
CAN, haut-parleurs, CNA, microphone, et bloqueur d’ordre zéro
Question 2 :
SAVOIR LIRE UN CHRONOGRAMME
On trouve dans un chronogramme la représentation temporelle d’un signal audio.
Savez vous tirer du chronogramme ci-dessus les informations demandées ?
quel est l’intervalle des valeurs permises pour l’intensité du signal audio ?
1.
que valent les valeurs maximale et minimale de l’intensité du signal ?
2.
quelle est à peu près la durée du signal représenté ?
3.
pourquoi peut on supposer raisonnablement qu’il s’agit d’un signal bloqué ?
4.
si c’est un signal bloqué, évaluer la période d’échantillonnage
5.
Jean-Paul Stromboni, ESSI
le 02/03/2005
Exemple :
Réponses
1.
c’est IVP = [−1,1]
valeur maximale d’intensité : ≈ +0.5 valeur minimale ≈ −0.5 unités du signal.
2.
3.
environ 5.7 ms
4.
il se présente comme une suite de paliers constants de même durée.
Te = 0.125 ms
5.
Précision :
Étapes de résolution
Pour répondre aux questions posées, on suggère
de lire sur le chronogramme en ordonnée (sur l’échelle verticale) les valeurs
1.
maximale et minimale, car elles délimitent l’intervalle demandé
de suivre le tracé du signal audio et lire sur l’axe vertical la plus grande valeur
2.
atteinte et la plus petite
de lire les graduations de l’axe horizontal, axe des abscisses, et soustraire la
3.
plus petite valeur de cet axe à la plus grande valeur atteinte.
4.
de consulter les informations sur le bloqueur d’ordre zéro, et le signal bloqué.
de mesurer la durée des segments horizontaux, ou puisque cette durée est
5.
identique, de mesurer le nombre de paliers dans une division temporelle et d’en
déduire la durée d’un seul palier.
Question 3 :
SAVOIR NUMÉRISER UN SIGNAL AUDIO
Pour numériser un signal audio, on lui applique deux transformations qui sont : sur
l’axe du temps, l’échantillonnage et sur l’axe des intensités, la quantification.
Le signal audio représenté ci-dessous en pointillés bleus a été numérisé sur le papier
en rouge, avec les paramètres de numérisation B = 3bit pour la longueur binaire des
échantillons, et f e = 1000 Hz pour la fréquence d’échantillonnage :
1.
2.
3.
4.
5.
dénombrer les échantillons représentés et préciser leurs valeurs
calculer le pas de quantification
mesurer la période d’échantillonnage
évaluer l’erreur de quantification en t = 0.01s
la contrainte de Shannon est-elle respectée ici ?
Jean-Paul Stromboni, ESSI
Exemple :
le 02/03/2005
Réponses
1. 12 valeurs ou points rouges :
{0,0.25,−0.75,0.5,−0.75,0.5,−0.75,0.25,−0.25,−0.25,0.25,−0.75}.
2. pas de quantification : 0.25
3. période d’échantillonnage 0.001s
4. à peu près 0.20 unités d’intensité du signal
5. oui.
Précision :
Étapes de résolution
Pour répondre à ces questions, on suggère de procéder comme suit :
1. compter les échantillons aux instants multiples de la période d’échantillonnage et
mesurer à chaque fois l’ordonnée pour avoir la valeur quantifiée
2. calculer le pas de quantification en divisant l’intervalle IVP = [−1,1] des valeurs
possibles par le nombre de niveaux de quantification déduit de B .
3. mesurer l’écart temporel entre deux échantillons ou période d’échantillonnage
4. mesurer l’écart entre la valeur du signal à cet instant et la valeur de l’échantillon
5. vérifier qu’il y a au moins deux échantillons dans une période du signal
Question 4 :
CHOISIR LA FRÉQUENCE D’ÉCHANTILLONNAGE
On ne choisit pas n’importe comment la fréquence d’échantillonnage d’un signal, il
faut respecter la contrainte de Shannon.
Par conséquent, la question est ici : comment choisir la fréquence d’échantillonnage
notée f e du signal s (t ) donné par l’expression mathématique suivante ?
cos( 2640 π t )
s ( t ) = cos( 880 π t ) +
9
Exemple :
Réponse
f e > 2640 Hz
Précision :
Étapes de résolution
Pour résoudre cette question, on suggère :
de déterminer la plus grande fréquence présente dans s(t) à l’aide de la notion
1.
de spectre appliquée à un signal sinusoïdal.
On doublera ensuite la fréquence trouvée et on écrira la contrainte de Shannon
2.
qui fournit la réponse attendue.
Question 5 :
CALCULER LA TAILLE D’UN FICHIER AUDIO
Avant de télécharger un fichier audio, il est raisonnable de savoir évaluer sa taille :
1. On demande de calculer la taille d’un fichier audio non compressé et numérisé avec
la qualité CD, sur une durée de 180 s .
2. puis, prévoir la durée de téléchargement sur la bande téléphonique grand public
3. quel est le débit de téléchargement à soutenir pour jouer le fichier téléchargé sans le
ralentir
4. quel est le taux de compression à mettre en œuvre pour jouer le fichier sans ralentir
Jean-Paul Stromboni, ESSI
le 02/03/2005
Exemple :
Réponses
1. 254 016 000 bit .
2. 3969 sec
3. 1411200 bps
4. 22.05 (sans unité)
Précision :
Étapes de résolution
Pour répondre aux questions posées, on suggère :
1. de chercher la qualité CD et de calculer le débit de téléchargement associé, cf. On
multipliera ce débit par la durée du fichier audio pour obtenir la taille du fichier.
2. de noter le débit associé à la qualité téléphonique, et de diviser la taille du fichier à
télécharger par ce débit (on peut procéder aussi sans utiliser la taille du fichier !).
3. de retrouver le débit de numérisation associé à la qualité CD c’est le débit
demandé pour jouer le fichier sans ralentir.
4. de diviser le débit associé à la qualité CD par celui de la qualité téléphonique.
Question 6 :
TIRER LES CONSÉQUENCES DE LA CONTRAINTE DE SHANNON
La contrainte de Shannon peut expliquer dans une certaine mesure la fréquence
d’échantillonnage utilisée dans les CD.
Comment justifier la fréquence d’échantillonnage de valeur f e = 44100 Hz de la
qualité CD musicale ? Et peut-on justifier f e = 8kHz de la qualité téléphonique ?
Exemple :
Réponses
Pour justifier la qualité CD, f e = 44100 Hz > 2 × 20000 Hz .
Pour la qualité téléphonique, f e = 8000 Hz > 2 × 3300 Hz
Précision :
Étapes de résolution :
Pour répondre à ces questions, on suggère de retrouver la limite de l’audition humaine
d’une part, la bande téléphonique grand public d’autre part, et d’appliquer la
contrainte de Shannon avec une marge de sécurité supplémentaire de 10% dans le cas
de la qualité CD, et de 20% dans le cas de la qualité téléphonique.
L’oreille humaine perçoit les fréquences pouvant aller jusqu’à 20000 Hz .
La bande téléphonique grand public s’étend de 300 Hz à 3300 Hz .