Télécharger le cours
Transcription
Télécharger le cours
U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Audio Numérique Leçon n°1 :Principes Pascal Mignot [email protected] U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Rappels de physique Rappels U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E son analogique Son = vibration des couches d’air. Dispositif audio de base: Une membrane couplée à un solénoïde (= une bobine). Enregistrement (micro) Un son fait mécaniquement vibrer la membrane, qui déplace la bobine qui produit un courant électrique. Ecoute (Haut-parleur) Signal Analogique Le courant électrique fait se déplacer la bobine, qui fait vibrer la membrane, qui fait mécaniquement se déplacer les couche d’air. Signal Analogique Note: si on renvoie le courant électrique généré par un son dans une bobine, on réobtient le même son (exemple de la fréquence unique). Courant = fonction s(t), l’espace temporel t est continu (à notre échelle, conjecture 10-42) = signal analogique. Vitesse du son U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Dépend: • du milieu de propagation (air, eau, métal, …) • de la température Vitesse dans l’air (en m/s, Tc = température de l’air en degré Celsius). VS = 20.05 × TC + 273.15 ≈ 331.4 + 0.6 × TC A température ambiante (20°), Vs = 343 m/s. Autres milieux: Oscillation longitudinale Oscillation transverse Liquide VL Corps VL Matériaux VT Matériaux VL VT Eau à O° 1402 Crane 4080 Erable 4110 Aluminum 6420 3040 Eau à 20° 1482 Muscle 1585 Brique 3650 Acier 5790 3100 Mer à 20° 1522 Chair 1540 Marbre 3810 Or 3240 1200 Huile de castor 1477 Sang 1570 Liège 500 Pyrex 5640 3280 Mesure du son U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E fréquence, période et longueur d’onde Rappel pour un signal périodique: T = druée d’une période (en seconde) f = nombre de période par seconde (en Hertz) λ = longueur d’onde (en mètre) Rappel des liens entre ces quantités: f = 1/T λ = c / f (où c est la vitesse de déplacement de l’onde; pour le son c=343m/s). Frequence (Hz) Longueur d’onde (m) 63 125 250 500 1K 2K 4K 8K 5.46 2.75 1.38 0.69 0.34 0.17 0.085 0.043 Mesure du son U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E puissance et intensité Puissance sonore: N (en W): puissance de référence: N0 = 10-12W (limite d’audibilité). niveau de puissance (en dB): Lw = 10 log (N/N0) en général pour mesure la puissance d’une source sonore (voir la table ci-après). L’étendue des puissances audibles justifie l’utilisation d’une échelle logarithmique. Intensité sonore: I (en W/m2) intensité de référence: I0 = 10-12 W/m2 (limite d’audibilité). niveau d’intensité (en dB): Li = 10 log (I/I0) Note: log = le log en base 10 Source N (W) Saturn Rocket 100,000,000 200 100,000 170 10,000 160 1,000 150 100 140 10 130 1 120 0.1 110 0.01 100 Jet engine U N IVERSIT É D E R EIMS jet engine CInside H AMP AGN E-A RD EN N Etest cell Large centrifugal fan, 800.000 m3/h Axial fan, 100.000 m3/h, Symphonic orchestra Large chipping hammer, Human pain limit Large aircraft 150 over head, Centrifugal van, 25.000 m3/h, Blaring radio Large air compressor, Air chisel, Magnetic drill press, High pressure gas leak, Banging of steel plate, Drive gear, Car on highway, Normal fan Cut-off saw, Hammer mill, Small air compressor, Grinder, Heavy diesel vehicle, Heavy city traffic, Lawn mover, Maximum sound up to 8 hour (OSHA1) criteria - engineering or administrative noise controls), Jackhammer at 15 m, Bulldozer at 15 m Maximum sound up to 8 hour (OSHA criteria - hearing conservation program), Pneumatic tools at 15 m, Alarm clock, Buses, trucks, motorcycles at 15 m, Dishwasher Car at 15 m, Vacuum cleaner at 3 m, Voice, conversation Large department store, Busy restaurant or canteen Room with window air conditioner Voice, low Voice, soft whisper, Room in a quiet dwelling at midnight Noise at ear from rustling leaves Quietest audible sound for persons under normal conditions Quietest audible sound for persons with excellent hearing under laboratory conditions2) Lw (dB) 0.001 90 0.0001 80 0.00001 70 0.000001 60 0.0000001 50 0.00000001 40 0.000000001 30 0.0000000001 20 0.00000000001 10 0.000000000001 0 Mesure du son le décibel U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Source Utilisée pour le mesure d’une puissance reçue. Pression sonore: p (en N/m2 ou Pa) pression de référence: P0=2.10-5 N/m2 (limite d’audibilité). niveau de pression (en dB): Lp=10 log( P2 / P02 ) remarques: 1. si la pression est doublée, le niveau augmente de 6dB ( = 20 log 2). 2. C’est cette quantité que est utilisée pour mesurer le niveau sonore d’un bruit. 3. Il s’agit de rapport, donc Lp , Li et Lw réprésentent la même quantité. Notes: – Mesurable avec un microphone (pression sur la membrane). – La pression sonore est utilisée pour quantifier le niveau du son. Threshold of hearing Lp (dB) 0 Rustling leaves 20 Quiet whisper (1 m) 30 Home 40 Quiet street 50 Conversation 60 Inside a car 70 Loud singing 75 Automobile (10 m) 80 Motorcycle (10 m) 88 Food blender (1 m) 90 Subway (inside) 94 Diesel truck (10 m) 100 Lawn mower (1 m) 107 Pneumatic riveter (1 m) 115 Chainsaw (1 m) 117 Amplified Hard Rock (2 m) 120 Jet plane (30 m) 130 Loi de l’inverse du carré de la distance U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Cette loi décrit la décroissance de l’intensité sonore I (en W/m2) d’une source de puissance P (en W) à une distance d (en m): P I= 4πd 2 Autrement dit, si on double la distance, l’intensité sonore est divisée par 4. Exemple: voiture sur l’autoroute, P=0.01W, à 15 mètres, I = 0.01 / 4π.152 = 3.5 x 10-6 W/m2 ⇒ I = 65dB distance 1 2 4 8 16 32 64 128 256 512 1024 I (dB) 89 83 77 71 65 59 53 47 41 35 29 Note: cette loi ne prend pas en compte les effets atmosphériques. U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Aspects Psycho-auditifs Aspects psycho-auditifs C H AMP AGN E-A RD EN N E En dessous: infra-son Au dessus: ultra-son Voix humaine: 600Hz → 4KHz phoque 55kHz 150kHz baleine rongeur 100kHz 1kHz 100Hz 50kHz sauterelle 1kHz chauve-souris 150kHz 40kHz vache 16Hz éléphant 12kHz 16Hz 31Hz cheval 40kHz chien 40Hz 46kHz 100Hz 32kHz chat 20kHz 20Hz homme infrason spectre audible: 20Hz → 20KHz 1 10 200Hz 70Hz 2 10 3 10 4 10 5 10 ultrason le spectre audible U N IVERSIT É D E R EIMS 6 10 Hz Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E le volume (loudness) Deux sons différents de X dB ne semblent en général pas avoir le même volume, i.e. la perception du volume d’un son n’est pas simplement liée à la pression sonore (ou à l’énergie ou à l’intensité sonore). N phons = niveau sonore de N dB d’un ton de fréquence 1KHz. L’intensité perçue d’un son dépend de sa fréquence. Interprétation: • • courbes perceptuelle iso-volume les sons graves sembles avoir un volume plus bas. fréquences que l’on entend le mieux (500-7KHz). Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E fréquence/volume L’échelle des fréquences perçues par l’oreille humaine dépend de l’intensité sonore: • à faible niveau sonore, on perçoit les hautes fréquences. • l’étendue des fréquences entendues s’étend avec l’intensité. A noter que la perception des hautes fréquences se détériore avec l’age. Aspects psycho-auditifs la tonalité (pitch) U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Tonalité = perception humaine de la fréquence. En musique, • Octaves un octave = intervalle entre 2 gammes octave suivant = multiplier la fréquence par 2. • Notes note suivante = multiplier la fréquence par 21/12. • Accord de base deux notes jouées en même temps dont le rapport est l’un des suivants: 3/2, 4/3, 5/4, 6/5, 5/3, 8/5, 2 Do Ré Sol Mi Fa Si Do Echelle Logarithmique Do# f 21/12f Ré# Fa# 25/12f La# 29/12f 2f Note F0 F1 F2 Do Do# Ré Ré# Mi Fa Fa# Sol Sol# La La# Si 8.176 8.662 9.177 9.723 10.301 10.913 11.562 12.250 12.978 13.750 14.568 15.434 16.352 17.324 18.354 19.445 20.601 21.826 23.124 24.499 25.956 27.50 29.135 30.867 32.703 34.648 36.708 38.890 41.203 43.653 46.249 48.999 51.913 55.000 58.270 61.735 U N IVERSIT É D E R EIMS Harmoniques et Timbre C H AMP AGN E-A RD EN N E En général, pour un instrument du musique ou chaque phonème d’une voix, le son produit n’a pas une fréquence unique. Harmoniques = multiples (entiers) de la fréquence fondamentale. Exemple pour un violon avec une fréquence fondamentale à f=392Hz. Les pics de fréquence suivants sont à 2f, 3f, 4f, … Timbre = “mélange” de la fréquence fondamentale et de ses harmoniques (= caractéristique d’un instrument). U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Conversion Analogique-Numérique Signal numérique conversion A/N : échantillonnage U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Echantillonnage: représenter le signal s(t) par une suite de couple {ti,s(ti)} dans le cas de l’échantillonnage uniforme : ti = t0 + i.δ avec δ = pas d’échantillonage (intervalle de temps entre deux échantillons, en seconde), f = 1/ δ fréquence d’échantillonnage (nombre d’échantillons par seconde, en Hz). si = s(ti), l’échantillon associé à l’instant ti. Théorème de Nyquist: pour représenter correctement un signal de fréquence maximale fmax, il faut l’échantillonner avec une fréquence fmax/2. • Représentation correcte = pouvoir reconstruire exactement le signal analogique à partir du signal discret. • Critère évident … si l’on regarde ce qui se passe dans l’espace de Fourier. • Ne prend pas en compte la quantification. Corollaire: Si le signal a une fréquence supérieure à la fréquence d’échantillonnage fmax, il faut filtrer les fréquences supérieures à fmax/2. Si ces critères ne sont pas respectés: aliasing (repliement de spectre, cf cours SI/TI). Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E conversion A/N : quantification le signal {si} est discret, mais les valeurs si sont analogiques (prennent leurs valeurs dans un espace continu). Objectif: obtenir des valeurs codées en binaire. Quantification : l’intervalle de variation du signal [vmin,vmax] (global), est subdivisé en n=2p sous-intervalles Ij = [vj,vj+1]. la valeur si est codée par le nombre binaire j tel que si∈Ij erreur de quantification: |Ij|/2 quantification uniforme: les intervalles Ij ont tous la même taille (vrai pour l’audio). Reconstruction: la valeur reconstruite à partir du nombre binaire j est le centre de l’intervalle Ij. Signal numérique U N IVERSIT É D E R EIMS conversion A/N Quantification sur cet axe C H AMP AGN E-A RD EN N E Echantillonnage sur cet axe Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E quantification, aliasing & dithering une variation d’amplitude de l’ordre d’un bit (LSB) de la quantification peut engendrer un signal audio périodique cohérent (aliasing). l’ajout d’un bruit aléatoire (de l’ordre d’un demi-LSB) permet d’enlever toute cohérence au « bruit » de quantification. Signal numérique Quantification et dynamique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Le volume est directement codé à partir de la quantification uniforme de la pression sonore (pas d’aspect psycho-auditifs utilisé). Dans notre cas, si on utilise n bits, • on peut coder l’amplitude comme des valeurs de -2n-1 à 2n-1. • l’erreur de quantification est au plus de 2-1 (différence maximale entre la valeur du signal analogique et la valeur choisie) et ceci indépendamment de l’échelle (plage de variation) choisie. Le rapport signal sur bruit (SNR) dans le cas d’un signal numérique sonore se calcule comme: SNR= 20. log Psignal 2 n −1 = 20. log −1 = n × 20 log 2 = 6.02 × n (en dB) 2 Bits par valeur dB max. On obtient ainsi directement la dynamique possible pour notre signal (en gros, 1 bit de résolution par 6dB). 8 48 16 96 20 120 Clairement, on n’a pas envie de dépasser une dynamique de plus de 120dB (limite de tolérance), donc une quantification de 20bits. 24 144 32 192 Pbruit Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E stockage au format PCM PCM = Pulse Code Modulation technique pour enregistrer les données sur un support numérique. la durée des impulsions détermine le nombre de 1, la durée d’absence d’impulsion le nombre de 0. les bits sont envoyés les uns à la suite des autres. Surface d’un CD-Rom observée avec un microscope électronique. …001001100100111… Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E enregistrement sur un support numérique au format PCM à partir d’une source analogique Filtre d’anti-aliasing : filtre passe-bas. Sample and Held : prend un échantillon et garde sa valeur (sortie = suite de paliers) A/N converter = échantillonnage + quantification. Multiplexer : interlace les deux signaux numérique en un seul signal. Processing : ajout de codes correcteurs d’erreur. Record modulation : conversion en PCM. Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E lecture d’un support numérique au format PCM et restitution sur une sortie analogique Signal numérique valeurs typiques U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Valeurs typiques pour l’audio: échantillonnage: 8, 32, 44, 96, 192 kHz quantification: 8, 10, 16, 20, 24 bits nombre de canaux = nombre de pistes: stéréo = 2 canaux indépendants, 5.1 = 5 canaux indépendants (basse = filtrage passe-bas) Valeur typique d’échantillonnage: 8 KHz 11.25 KHz 22.5 KHz 32 KHz 44.1 KHz 48 KHz téléphone voix musique (qualité radio AM) musique (qualité radio FM), Nicam CD DAT ou DVD Valeurs typique pour l’audio numérique haut qualité: CD : 16bits @ 44kHz stéréo, soit 2 x 16 x 44.000 = 1.4 Mbits/s DVD Dolby Digital: 48KHz @ 16,20 ou 24 bits sur 1 à 7 canaux. pour un son 5.1 à 48KHz @: 24 bits : 5 x 48.000 x 24 = 5.76 Mbit/s DVD audio: jusqu’à 24 bits @ 192kHz sur 2 canaux (stéréo) soit 24 x 192000 x 2 = 9.2 Mbits/s U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Aspects matériels Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E échantillonnage et quantification en pratique La dynamique et les fréquences audibles font qu’il ne sert a priori à rien d’échantillonner au-delà de 44kHz @ 16 bits. Pourtant, certains équipements HI-FI échantillonnent bien au-delà (ex:DVD-audio). Pourquoi suréchantillonner? • limite les erreurs de quantification lors de l’enregistrement du signal original. • permettre les prétraitements (filtres d’ambiance, etc…) sans perte par rapport au signal final souhaité (44kHz@16bits); i.e. le cumul des erreurs de quantification apparaît au-delà. Conséquence: • pour une application audio classique, inutile de dépasser 44kHz@16 bits. • 22 kHz : difficile de passer en dessous (exemple: criquets, symbale). U N IVERSIT É D E R EIMS amplification et atténuation C H AMP AGN E-A RD EN N E Les périphériques audio ou HIFI modernes n’amplifie pas le son mais l’atténue (permet de limiter les problèmes de distorsion liés à l’amplification). avant: 0 = silence 100 = maximum maintenant: 0 dB = maximum, -n dB = atténuation du son maximum de n dB. Conséquence: les APIs suivent le mouvement. Exemple: DirectSound volume de -10.000 à 0. atténuation en 100ème de décibel (i.e. -10.000 = atténation de 100dB). Reproduction type de HPs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E 3 principaux types de HPs: • woofers dédiés aux basses fréquences (en dessous de 500Hz). • midrange dédiés aux fréquences moyennes (de 250 à 2.500Hz). • tweeter dédiés aux hautes fréquences (de 1KHz à 20KHz). Enceinte = combinaisons de HPs et de filtres. Enceinte idéale = filtre dont la réponse est plate (ne privilégie aucune fréquence). Actuellement, maillon faible dans la chaîne de reproduction d’un son. U N IVERSIT É D E R EIMS Systèmes de HP C H AMP AGN E-A RD EN N E 4.1 5.1 6.1 7.1 « Audio 3D » • rendu latéral positionnement circulaire (champs sonore 360° degrés) et dans le plan aural (celui passant par les oreilles et dont la normale est l’axe vertical). • rendu vertical pas de dispositifs répandus jusqu’à présent (pour un rendu sphérique) U N IVERSIT É D E R EIMS Cartes son actuelles C H AMP AGN E-A RD EN N E • • • 32 à 128 canaux (= sons différents pouvant être joués en même temps). mixage hardware effets et reverb (réverbération) hardware • son hardware 3D suit les cartes graphiques 3D et le besoin de créer des environnements sonore 3D. HRTF (détaillé dans la partie son 3D): reconstituer un environnement 3D à partir de n HPs. • la mémoire système peut être utilisée par le périphérique audio (peu ou plus de mémoire sur les cartes audio) raison: bus PCI conséquences: plus de différence entre les buffers streaming (toujours en mémoire système) ou static (mémoire « locale ») Cartes son actuelles U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Exemple: audigy 4 Processeur Audigy 4 Pro Traitement avancé des effets numériques Traitement numérique 32 bits maintenant une gamme dynamique théorique de 192 dB Interpolation 8 points brevetée réduisant la distorsion à des niveaux inaudibles Synthétiseur matériel à table d'ondes de 64 voix Mixage et égalisation numériques de qualité professionnelle Qualité audio haute définition pour la lecture et l'enregistrement Lecture de 64 canaux audio, avec un taux d'échantillonnage arbitraire pour chaque canal Conversion analogique/numérique 24 bits d'entrées analogiques avec un taux d'échantillonnage de 96 kHz Conversion numérique/analogique 24 bits de sources numériques à un taux de 96 kHz en sortie haut-parleurs 7.1 analogiques Conversion numérique/analogique 24 bits de sources numériques stéréo à un taux de 192 kHz en sortie stéréo Taux d'échantillonnage d'enregistrement de 16 à 24 bits : 8 ; 11.025 ; 16 ; 22.05 ; 24 ; 32 ; 44.1 ; 48 et 96 kHz. Prise en charge du format SPDIF (Sony/Philips Digital Interface) jusqu'à 24 bits/96 kHz. Taux d'échantillonnage sélectionnable de 44.1 ; 48 ou 96 kHz Enregistrement multipistes à faible temps de latence avec prise en charge ASIO 2.0 à une résolution de 16 bits/48 kHz et 24 bits/96 kHz. Performance Audio Rapport Signal sur bruit (AES17, A-Weighted) Sortie Stereo 113dB Canaux Avant et Arrière 113dB Centre, Caisson de basse, Canaux latéraux 113dB Distorsion Harmonique Totale + bruit à 1kHz (AES17) = 0.003% (2V sortie à 2V) Réponse en fréquence +/-3dB: 10Hz à 46kHz Et maintenant, U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E A venir: • programmation bas-niveau avec DirectSound. niveau buffer • programmation audio environnemental. synthèse d’environnement sonore • programmation haut-niveau avec DirectMusic. gestion transparente des buffers et des formats En avant!