Numériser (le signal audio)

Transcription

Numériser (le signal audio)
Numériser le signal audio
Séance 2 , cours, 1 heure
auteur : Jean-Paul Stromboni
Idées clefs de la séance
De nombreuses applications utilisent les sons numériques, téléphone, CD
audio, ordinateur multimédia, radio, ...
L’objectif ici est d’introduire le concept de signal numérique, expliquer
comment un ordinateur numérise un son, définir la qualité de numérisation
donner des conséquences.
Savez vous répondre aux questions suivantes ?
Où trouve t’on un CAN dans un
ordinateur ?
Sur la carte son
Le bruit de quantification est-il un
bruit audible ?
Oui, il peut être gênant même
Pourquoi respecter la contrainte
Que signifie PCM ?
de Shannon ?
Pulse Coded Modulation,
Pour ne pas perdre d’information
Format non compressé
Comment échantillonner un son
de fréquence 10kHz ?
Il faut une fréquence
d’échantillonnage d’au
moins 20000Hz
Combien de pas de
quantification avec B=12 bits ?
4096 pas soit 212
S.S.I., ESSI1, le 8 février 2004
On numérise un signal sur 8bit, en
monophonie, à 8kHz, durant 180s.
Taille du fichier PCM nécessaire?
8x1x8000x180 bit
Si B=8 bit, quelle est la taille du pas
de quantification ?
C’est 2/ 28 = 0.008 à peu près
Page 1
Les objets traités par l'ordinateur
multimédia et le web sont numériques
• Numérique s'oppose à analogique
• multimédia numérique égale son et/ou images (=>
vidéo)
• son : illustration de ce cours, les domaines
d'application sont la musique et la parole
• traiter: enregistrer ou jouer, stocker, analyser,
télécharger, filtrer, etc ... par programmation
« one, two, three, four »
S.S.I., ESSI1, le 8 février 2004
Guitare LA3
Page 2
Numériser un son, c'est échantillonner et
quantifier le signal audio
•
•
signal : mesure d'une grandeur physique par un capteur
– signal audio : mesure par un microphone de la pression de
l'air fonction du temps.
– microphone : capteur transformant en tension électrique la
vibration de l'air propageant le son
échantillonner = prendre des mesures ou échantillons
périodiques
– on note Te la période d'échantillonnage (seconde)
– on note fe= 1/Te la fréquence d'échantillonnage,
fe (s'exprime en Hertz ou Hz).
s(t)
Te
S.S.I., ESSI1, le 8 février 2004
t
Page 3
Numériser un son, c'est échantillonner et
quantifier le signal audio
•
quantifier = coder en binaire les échantillons
–
•
on note B le nombre de bits d’un échantillon
L’intervalle [-1,1] des valeurs possibles du signal audio
est découpé en 2B pas de quantification égaux (cas
d’une loi de quantification uniforme).
on associe à l’échantillon s(nTe) le niveau de
quantification si, valeur choisie dans le pas :
•
1.
2.
1
la valeur centrale du pas (cas étudié, tracer en bleu)
la valeur minimum (cas du C.A.N. tracer en rouge)
s(t)
t
-1
S.S.I., ESSI1, le 8 février 2004
Page 4
L'ordinateur utilise sa carte son pour enregistrer et
pour jouer les sons numériques stockés dans sa
mémoire.
•
•
•
•
•
•
une carte son contient un CAN et un CNA [plus parfois
un DSP]
le CAN (Convertisseur Analogique Numérique) numérise
l'entrée micro de la carte son.
le CNA (Convertisseur Numérique Analogique) réalise
l'opération inverse pour jouer en temps réel un son
numérique sur la sortie haut-parleur de la carte son
haut-parleur = actionneur transformant une tension
électrique en vibrations de l'air (ou sons)
[le DSP (Digital Signal Processor) est un microprocesseur spécialisé dans le traitement du signal
Digital signifie numérique en anglais et Signal Processing
signifie traitement du signal]
Son,
micro s(t) signal CAN s(nTe)
vibration
électrique
B bit
de l’air
DSP
son
rbl(t)
HP bloqué
CNA
r(nTe)
microproc
Mémoire,
Traitement,
Filtre …
Carte son
S.S.I., ESSI1, le 8 février 2004
Page 5
L'ordinateur utilise sa carte son pour enregistrer et
pour jouer les sons numériques stockés dans sa
mémoire.
Compléter le schéma ci-dessous, après avoir
mémorisé la feuille précédente.
Préciser la nature et les propriétés de temps
et d’amplitude des signaux. Allure de rbl(t) ?
S.S.I., ESSI1, le 8 février 2004
Page 6
La qualité de numérisation d'un son croît
avec fe et B
• contrainte de Shannon : la fréquence
d'échantillonnage fe doit être au moins deux fois la
largeur du spectre du signal à échantillonner
– le spectre est la composition fréquencielle du signal (voir le
chapitre Spectre et TFD)
– par exemple, le signal s(t)=cos(2*440*pi*t) contient la
seule fréquence 440 Hz (ou LA3 musical) et doit être
échantillonné à fe= 880 Hz au moins.
•
Hertz (Hz) : unité de fréquence, comme radian par seconde (rd/s), on a :
1 rd/s = 2*pi Hz.
• Application de Shannon :
– comment faut-il échantillonner le signal
x(t)=cos(2*880*pi*t) (LA4) ?
Au moins à 1760Hz
– L’appareil auditif humain sait percevoir des fréquences
allant au mieux de 20Hz à 20kHz. Justifier en conséquence
la fréquence d’échantillonnage de 44100Hz des CD audios.
On prend au moins 2 fois 20kHz, plus une marge de sécurité
– Le téléphone grand public transmet sur la bande de
fréquence 300 Hz, 3300Hz, proposer une fréquence
d’échantillonnage en conséquence
Même raisonnement, 2 fois 3300 Hz plus une marge
S.S.I., ESSI1, le 8 février 2004
Page 7
La qualité de numérisation d'un son croît
avec fe et B
• l'erreur de quantification croît quand B décroît
et peut créer un bruit audible
– erreur de quantification = signal - signal quantifié
ε = s (nTe ) − si
• le rapport signal sur bruit (anglais SNR pour
Signal to Noise Ratio) mesure l'importance
relative du signal et de l'erreur
σs
SNRdB = 20 log10 ( )
σε
Questions :
1. si B= 8bits, quelle est la hauteur du pas de
quantification ?
2. si on utilise la valeur centrale du pas pour
quantifier, quelles sont alors les bornes de
l’erreur ?
Le pas valant 2/2B, l’erreur varie Entre -1/2B et 1/2B
3. SNR = 72dB, quelles sont les importances
relatives du signal et de l’erreur ?
72 c’est 6 fois 12, le signal est 212 fois plus grand que l’erreur
S.S.I., ESSI1, le 8 février 2004
Page 8
La qualité de numérisation d'un son croît
avec fe et B
• Ordres de grandeurs utiles
– l'audition humaine s'étend sur trois décades, de 20 Hz
à 20 kHz
• décade = intervalle de fréquences [f0, 10*f0]
• octave = intervalle de fréquence [f0, 2*f0]
– la phonation (spectre de la voix humaine) s’étend de
50 Hz à 7 kHz (bande élargie)
– La bande téléphonique grand public de 300 Hz à 3300
Hz
– qualité téléphonique : B = 8 bits, fe = 8000 Hz,
monophonie, soit 64000 bits par seconde (bps)
– qualité CD audio: 16 bits, 44100 Hz, stéréo
– entrée micro de la carte son : entre -1 et 1,
• Question: on souhaite télécharger un air de
musique de durée 3 mn et qualité CD :
– Prévoir la taille du fichier à télécharger
– La durée du téléchargement sur une ligne
téléphonique grand public sans compression
– le taux de compression à atteindre pour télécharger
et jouer en temps réel.
S.S.I., ESSI1, le 8 février 2004
Page 9
L'ordinateur utilise sa carte son pour
enregistrer et pour jouer les sons
numériques stockés dans sa mémoire.
• pour stocker un son numérique dans un
fichier, on adopte un format, règle de
rangement à respecter pour récupérer les
données ultérieurement
– le format PCM (pour Pulse Coded Modulation)
est non compressé
– le format ‘mp3’ (MPEG audio Layer 3) est
compressé, comme ‘au’, ‘ogg’, …
• la mémoire occupée par un son numérique
non compressé est donnée par la formule
taille = Nbvoies × B × fe × durée
• le débit à soutenir pour alimenter la carte
son est donné en bit par seconde (bps) par
débit [bps ] = Nbcanaux × B[bit ] × fe[ Hz ]
S.S.I., ESSI1, le 8 février 2004
Page 10