Télécharger le cours

Transcription

Télécharger le cours
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Audio Numérique
Leçon n°1 :Principes
Pascal Mignot
[email protected]
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Rappels de
physique
Rappels
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
son analogique
Son = vibration des couches d’air.
Dispositif audio de base:
Une membrane couplée à un solénoïde (= une bobine).
Enregistrement (micro)
Un son fait mécaniquement vibrer la membrane,
qui déplace la bobine qui produit un courant
électrique.
Ecoute (Haut-parleur)
Signal
Analogique
Le courant électrique fait se déplacer la bobine, qui
fait vibrer la membrane, qui fait mécaniquement
se déplacer les couche d’air.
Signal
Analogique
Note: si on renvoie le courant électrique généré par un son dans une bobine, on
réobtient le même son (exemple de la fréquence unique).
Courant = fonction s(t), l’espace temporel t est continu (à notre échelle, conjecture 10-42)
= signal analogique.
Vitesse du son
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Dépend:
• du milieu de propagation (air, eau, métal, …)
• de la température
Vitesse dans l’air (en m/s, Tc = température de l’air en degré Celsius).
VS = 20.05 × TC + 273.15
≈ 331.4 + 0.6 × TC
A température ambiante (20°), Vs = 343 m/s.
Autres milieux:
Oscillation
longitudinale
Oscillation
transverse
Liquide
VL
Corps
VL
Matériaux
VT
Matériaux
VL
VT
Eau à O°
1402
Crane
4080
Erable
4110
Aluminum
6420
3040
Eau à 20°
1482
Muscle
1585
Brique
3650
Acier
5790
3100
Mer à 20°
1522
Chair
1540
Marbre
3810
Or
3240
1200
Huile de castor
1477
Sang
1570
Liège
500
Pyrex
5640
3280
Mesure du son
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
fréquence, période et longueur d’onde
Rappel pour un signal périodique:
T = druée d’une période (en seconde)
f = nombre de période par seconde (en Hertz)
λ = longueur d’onde (en mètre)
Rappel des liens entre ces quantités:
f = 1/T
λ = c / f (où c est la vitesse de déplacement de l’onde; pour le son c=343m/s).
Frequence (Hz)
Longueur d’onde (m)
63
125
250
500
1K
2K
4K
8K
5.46
2.75
1.38
0.69
0.34
0.17
0.085
0.043
Mesure du son
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
puissance et intensité
Puissance sonore: N (en W):
puissance de référence: N0 = 10-12W (limite d’audibilité).
niveau de puissance (en dB):
Lw = 10 log (N/N0)
en général pour mesure la puissance d’une source sonore (voir la
table ci-après). L’étendue des puissances audibles justifie
l’utilisation d’une échelle logarithmique.
Intensité sonore: I (en W/m2)
intensité de référence: I0 = 10-12 W/m2 (limite d’audibilité).
niveau d’intensité (en dB):
Li = 10 log (I/I0)
Note: log = le log en base 10
Source
N (W)
Saturn Rocket
100,000,000
200
100,000
170
10,000
160
1,000
150
100
140
10
130
1
120
0.1
110
0.01
100
Jet engine
U N IVERSIT É
D E R EIMS
jet
engine
CInside
H AMP AGN
E-A
RD EN N Etest cell
Large centrifugal fan, 800.000 m3/h
Axial fan, 100.000 m3/h, Symphonic orchestra
Large chipping hammer, Human pain limit
Large aircraft 150 over head, Centrifugal van, 25.000 m3/h, Blaring radio
Large air compressor, Air chisel, Magnetic drill press, High pressure gas
leak, Banging of steel plate, Drive gear, Car on highway, Normal fan
Cut-off saw, Hammer mill, Small air compressor, Grinder, Heavy diesel
vehicle, Heavy city traffic, Lawn mover, Maximum sound up to 8 hour
(OSHA1) criteria - engineering or administrative noise controls),
Jackhammer at 15 m, Bulldozer at 15 m
Maximum sound up to 8 hour (OSHA criteria - hearing conservation
program), Pneumatic tools at 15 m, Alarm clock, Buses, trucks, motorcycles
at 15 m, Dishwasher
Car at 15 m, Vacuum cleaner at 3 m, Voice, conversation
Large department store, Busy restaurant or canteen
Room with window air conditioner
Voice, low
Voice, soft whisper, Room in a quiet dwelling at midnight
Noise at ear from rustling leaves
Quietest audible sound for persons under normal conditions
Quietest audible sound for persons with excellent hearing under laboratory
conditions2)
Lw (dB)
0.001
90
0.0001
80
0.00001
70
0.000001
60
0.0000001
50
0.00000001
40
0.000000001
30
0.0000000001
20
0.00000000001
10
0.000000000001
0
Mesure du son
le décibel
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Source
Utilisée pour le mesure d’une puissance
reçue.
Pression sonore: p (en
N/m2
ou Pa)
pression de référence: P0=2.10-5 N/m2 (limite
d’audibilité).
niveau de pression (en dB):
Lp=10 log( P2 / P02 )
remarques:
1. si la pression est doublée, le niveau
augmente de 6dB ( = 20 log 2).
2. C’est cette quantité que est utilisée pour
mesurer le niveau sonore d’un bruit.
3. Il s’agit de rapport, donc Lp , Li et Lw
réprésentent la même quantité.
Notes:
– Mesurable avec un microphone (pression
sur la membrane).
– La pression sonore est utilisée pour
quantifier le niveau du son.
Threshold of hearing
Lp (dB)
0
Rustling leaves
20
Quiet whisper (1 m)
30
Home
40
Quiet street
50
Conversation
60
Inside a car
70
Loud singing
75
Automobile (10 m)
80
Motorcycle (10 m)
88
Food blender (1 m)
90
Subway (inside)
94
Diesel truck (10 m)
100
Lawn mower (1 m)
107
Pneumatic riveter (1 m)
115
Chainsaw (1 m)
117
Amplified Hard Rock (2 m)
120
Jet plane (30 m)
130
Loi de l’inverse du carré
de la distance
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Cette loi décrit la décroissance de l’intensité sonore I (en W/m2)
d’une source de puissance P (en W) à une distance d (en m):
P
I=
4πd 2
Autrement dit, si on double la distance, l’intensité sonore est divisée
par 4.
Exemple: voiture sur l’autoroute, P=0.01W,
à 15 mètres, I = 0.01 / 4π.152 = 3.5 x 10-6 W/m2 ⇒ I = 65dB
distance
1
2
4
8
16
32
64
128
256
512
1024
I (dB)
89
83
77
71
65
59
53
47
41
35
29
Note: cette loi ne prend pas en compte les effets atmosphériques.
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Aspects
Psycho-auditifs
Aspects psycho-auditifs
C H AMP AGN E-A RD EN N E
En dessous:
infra-son
Au dessus:
ultra-son
Voix humaine:
600Hz → 4KHz
phoque
55kHz
150kHz
baleine
rongeur 100kHz
1kHz
100Hz
50kHz
sauterelle
1kHz chauve-souris 150kHz
40kHz
vache
16Hz
éléphant
12kHz
16Hz
31Hz
cheval
40kHz
chien
40Hz
46kHz
100Hz
32kHz
chat
20kHz
20Hz
homme
infrason
spectre audible:
20Hz → 20KHz
1
10
200Hz
70Hz
2
10
3
10
4
10
5
10
ultrason
le spectre audible
U N IVERSIT É
D E R EIMS
6
10 Hz
Aspects psycho-auditifs
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
le volume (loudness)
Deux sons différents de X dB ne semblent en général pas avoir le même
volume, i.e. la perception du volume d’un son n’est pas simplement liée à
la pression sonore (ou à l’énergie ou à l’intensité sonore).
N phons = niveau sonore de
N dB d’un ton de
fréquence 1KHz.
L’intensité perçue d’un son
dépend de sa fréquence.
Interprétation:
•
•
courbes perceptuelle iso-volume
les sons graves sembles
avoir un volume plus bas.
fréquences que l’on entend le
mieux (500-7KHz).
Aspects psycho-auditifs
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
fréquence/volume
L’échelle des fréquences perçues par l’oreille humaine dépend de l’intensité sonore:
• à faible niveau sonore, on perçoit les hautes fréquences.
• l’étendue des fréquences entendues s’étend avec l’intensité.
A noter que la perception des hautes fréquences se détériore avec l’age.
Aspects psycho-auditifs
la tonalité (pitch)
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Tonalité = perception humaine de la fréquence.
En musique,
• Octaves
un octave = intervalle entre 2 gammes
octave suivant = multiplier la fréquence par 2.
•
Notes
note suivante = multiplier la fréquence par 21/12.
•
Accord de base
deux notes jouées en même temps dont le
rapport est l’un des suivants: 3/2, 4/3, 5/4,
6/5, 5/3, 8/5, 2
Do
Ré
Sol
Mi Fa
Si Do
Echelle
Logarithmique
Do#
f
21/12f
Ré#
Fa#
25/12f
La#
29/12f
2f
Note
F0
F1
F2
Do
Do#
Ré
Ré#
Mi
Fa
Fa#
Sol
Sol#
La
La#
Si
8.176
8.662
9.177
9.723
10.301
10.913
11.562
12.250
12.978
13.750
14.568
15.434
16.352
17.324
18.354
19.445
20.601
21.826
23.124
24.499
25.956
27.50
29.135
30.867
32.703
34.648
36.708
38.890
41.203
43.653
46.249
48.999
51.913
55.000
58.270
61.735
U N IVERSIT É
D E R EIMS
Harmoniques et Timbre
C H AMP AGN E-A RD EN N E
En général, pour un instrument du musique ou chaque phonème
d’une voix, le son produit n’a pas une fréquence unique.
Harmoniques = multiples (entiers) de la fréquence fondamentale.
Exemple pour un violon
avec une fréquence
fondamentale à f=392Hz.
Les pics de fréquence
suivants sont à 2f, 3f, 4f,
…
Timbre = “mélange” de la fréquence fondamentale et de ses
harmoniques (= caractéristique d’un instrument).
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Conversion
Analogique-Numérique
Signal numérique
conversion A/N : échantillonnage
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Echantillonnage:
représenter le signal s(t) par une suite de couple {ti,s(ti)}
dans le cas de l’échantillonnage uniforme : ti = t0 + i.δ
avec δ = pas d’échantillonage (intervalle de temps entre deux échantillons, en seconde),
f = 1/ δ fréquence d’échantillonnage (nombre d’échantillons par seconde, en Hz).
si = s(ti), l’échantillon associé à l’instant ti.
Théorème de Nyquist: pour représenter correctement un signal de fréquence
maximale fmax, il faut l’échantillonner avec une fréquence fmax/2.
• Représentation correcte = pouvoir reconstruire exactement le signal
analogique à partir du signal discret.
• Critère évident … si l’on regarde ce qui se passe dans l’espace de Fourier.
• Ne prend pas en compte la quantification.
Corollaire: Si le signal a une fréquence supérieure à la fréquence
d’échantillonnage fmax, il faut filtrer les fréquences supérieures à fmax/2.
Si ces critères ne sont pas respectés: aliasing (repliement de spectre, cf cours
SI/TI).
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
conversion A/N : quantification
le signal {si} est discret, mais les valeurs si sont analogiques (prennent
leurs valeurs dans un espace continu).
Objectif: obtenir des valeurs codées en binaire.
Quantification :
l’intervalle de variation du signal [vmin,vmax] (global), est subdivisé en n=2p
sous-intervalles Ij = [vj,vj+1].
la valeur si est codée par le nombre binaire j tel que si∈Ij
erreur de quantification: |Ij|/2
quantification uniforme: les intervalles Ij ont tous la même taille (vrai pour
l’audio).
Reconstruction:
la valeur reconstruite à partir du nombre binaire j est le centre de
l’intervalle Ij.
Signal numérique
U N IVERSIT É
D E R EIMS
conversion A/N
Quantification sur cet axe
C H AMP AGN E-A RD EN N E
Echantillonnage sur cet axe
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
quantification, aliasing & dithering
une variation d’amplitude de l’ordre d’un bit (LSB) de la quantification
peut engendrer un signal audio périodique cohérent (aliasing).
l’ajout d’un bruit aléatoire (de l’ordre d’un demi-LSB) permet
d’enlever toute cohérence au « bruit » de quantification.
Signal numérique
Quantification et dynamique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Le volume est directement codé à partir de la quantification uniforme de la
pression sonore (pas d’aspect psycho-auditifs utilisé).
Dans notre cas, si on utilise n bits,
• on peut coder l’amplitude comme des valeurs de -2n-1 à 2n-1.
• l’erreur de quantification est au plus de 2-1 (différence maximale entre la
valeur du signal analogique et la valeur choisie)
et ceci indépendamment de l’échelle (plage de variation) choisie.
Le rapport signal sur bruit (SNR) dans le cas d’un signal numérique sonore se
calcule comme:
SNR= 20. log
Psignal
2 n −1
= 20. log −1 = n × 20 log 2 = 6.02 × n (en dB)
2
Bits par
valeur
dB
max.
On obtient ainsi directement la dynamique possible pour notre signal
(en gros, 1 bit de résolution par 6dB).
8
48
16
96
20
120
Clairement, on n’a pas envie de dépasser une dynamique de plus de
120dB (limite de tolérance), donc une quantification de 20bits.
24
144
32
192
Pbruit
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
stockage au format PCM
PCM = Pulse Code Modulation
technique pour enregistrer les données sur un support numérique.
la durée des impulsions détermine le nombre de 1, la durée d’absence d’impulsion le nombre
de 0.
les bits sont envoyés les uns à la suite des autres.
Surface d’un CD-Rom observée avec
un microscope électronique.
…001001100100111…
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
enregistrement sur un support numérique au
format PCM à partir d’une source analogique
Filtre d’anti-aliasing : filtre passe-bas.
Sample and Held : prend un échantillon
et garde sa valeur (sortie = suite de
paliers)
A/N converter = échantillonnage +
quantification.
Multiplexer : interlace les deux signaux
numérique en un seul signal.
Processing : ajout de codes correcteurs
d’erreur.
Record modulation : conversion en
PCM.
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
lecture d’un support numérique au format PCM
et restitution sur une sortie analogique
Signal numérique
valeurs typiques
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Valeurs typiques pour l’audio:
échantillonnage: 8, 32, 44, 96, 192 kHz
quantification:
8, 10, 16, 20, 24 bits
nombre de canaux = nombre de pistes:
stéréo = 2 canaux indépendants,
5.1
= 5 canaux indépendants (basse = filtrage passe-bas)
Valeur typique d’échantillonnage:
8
KHz
11.25 KHz
22.5 KHz
32
KHz
44.1 KHz
48
KHz
téléphone
voix
musique (qualité radio AM)
musique (qualité radio FM), Nicam
CD
DAT ou DVD
Valeurs typique pour l’audio numérique haut qualité:
CD : 16bits @ 44kHz stéréo,
soit 2 x 16 x 44.000 = 1.4 Mbits/s
DVD Dolby Digital: 48KHz @ 16,20 ou 24 bits sur 1 à 7 canaux.
pour un son 5.1 à 48KHz @: 24 bits : 5 x 48.000 x 24 = 5.76 Mbit/s
DVD audio: jusqu’à 24 bits @ 192kHz sur 2 canaux (stéréo)
soit 24 x 192000 x 2 = 9.2 Mbits/s
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Aspects
matériels
Signal numérique
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
échantillonnage et quantification en pratique
La dynamique et les fréquences audibles font qu’il ne sert a priori à
rien d’échantillonner au-delà de 44kHz @ 16 bits.
Pourtant, certains équipements HI-FI échantillonnent bien au-delà
(ex:DVD-audio).
Pourquoi suréchantillonner?
• limite les erreurs de quantification lors de l’enregistrement du
signal original.
• permettre les prétraitements (filtres d’ambiance, etc…) sans
perte par rapport au signal final souhaité (44kHz@16bits); i.e. le
cumul des erreurs de quantification apparaît au-delà.
Conséquence:
• pour une application audio classique, inutile de dépasser
44kHz@16 bits.
• 22 kHz : difficile de passer en dessous (exemple: criquets,
symbale).
U N IVERSIT É
D E R EIMS
amplification et atténuation
C H AMP AGN E-A RD EN N E
Les périphériques audio ou HIFI modernes n’amplifie pas le son mais
l’atténue (permet de limiter les problèmes de distorsion liés à
l’amplification).
avant:
0
= silence
100 = maximum
maintenant:
0 dB = maximum,
-n dB = atténuation du son maximum de n dB.
Conséquence: les APIs suivent le mouvement.
Exemple: DirectSound
volume de -10.000 à 0.
atténuation en 100ème de décibel (i.e. -10.000 = atténation de 100dB).
Reproduction
type de HPs
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
3 principaux types de HPs:
• woofers
dédiés aux basses fréquences
(en dessous de 500Hz).
•
midrange
dédiés aux fréquences
moyennes (de 250 à
2.500Hz).
•
tweeter
dédiés aux hautes fréquences
(de 1KHz à 20KHz).
Enceinte = combinaisons de HPs
et de filtres.
Enceinte idéale = filtre dont la
réponse est plate (ne privilégie
aucune fréquence).
Actuellement, maillon faible dans
la chaîne de reproduction d’un
son.
U N IVERSIT É
D E R EIMS
Systèmes de HP
C H AMP AGN E-A RD EN N E
4.1
5.1
6.1
7.1
« Audio 3D »
• rendu latéral
positionnement circulaire (champs sonore 360° degrés) et dans le plan
aural (celui passant par les oreilles et dont la normale est l’axe vertical).
•
rendu vertical
pas de dispositifs répandus jusqu’à présent (pour un rendu sphérique)
U N IVERSIT É
D E R EIMS
Cartes son actuelles
C H AMP AGN E-A RD EN N E
•
•
•
32 à 128 canaux (= sons différents pouvant être joués en même
temps).
mixage hardware
effets et reverb (réverbération) hardware
•
son hardware 3D
suit les cartes graphiques 3D et le besoin de créer des environnements
sonore 3D.
HRTF (détaillé dans la partie son 3D):
reconstituer un environnement 3D à partir de n HPs.
•
la mémoire système peut être utilisée par le périphérique audio (peu
ou plus de mémoire sur les cartes audio)
raison: bus PCI
conséquences: plus de différence entre les buffers streaming (toujours en
mémoire système) ou static (mémoire « locale »)
Cartes son actuelles
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
Exemple: audigy 4
Processeur Audigy 4 Pro
Traitement avancé des effets numériques
Traitement numérique 32 bits maintenant une gamme dynamique théorique de 192 dB
Interpolation 8 points brevetée réduisant la distorsion à des niveaux inaudibles
Synthétiseur matériel à table d'ondes de 64 voix
Mixage et égalisation numériques de qualité professionnelle
Qualité audio haute définition pour la lecture et l'enregistrement
Lecture de 64 canaux audio, avec un taux d'échantillonnage arbitraire pour chaque canal
Conversion analogique/numérique 24 bits d'entrées analogiques avec un taux d'échantillonnage de
96 kHz
Conversion numérique/analogique 24 bits de sources numériques à un taux de 96 kHz en sortie
haut-parleurs 7.1 analogiques
Conversion numérique/analogique 24 bits de sources numériques stéréo à un taux de 192 kHz en
sortie stéréo
Taux d'échantillonnage d'enregistrement de 16 à 24 bits : 8 ; 11.025 ; 16 ; 22.05 ; 24 ; 32 ; 44.1 ; 48 et
96 kHz.
Prise en charge du format SPDIF (Sony/Philips Digital Interface) jusqu'à 24 bits/96 kHz. Taux
d'échantillonnage sélectionnable de 44.1 ; 48 ou 96 kHz
Enregistrement multipistes à faible temps de latence avec prise en charge ASIO 2.0 à une résolution
de 16 bits/48 kHz et 24 bits/96 kHz.
Performance Audio
Rapport Signal sur bruit (AES17, A-Weighted)
Sortie Stereo
113dB
Canaux Avant et Arrière
113dB
Centre, Caisson de basse, Canaux latéraux
113dB
Distorsion Harmonique Totale + bruit à 1kHz (AES17) = 0.003% (2V sortie à 2V)
Réponse en fréquence +/-3dB: 10Hz à 46kHz
Et maintenant,
U N IVERSIT É
D E R EIMS
C H AMP AGN E-A RD EN N E
A venir:
• programmation bas-niveau avec DirectSound.
niveau buffer
• programmation audio environnemental.
synthèse d’environnement sonore
• programmation haut-niveau avec DirectMusic.
gestion transparente des buffers et des formats
En avant!