Rapport bibliographique - Master Acoustique Marseille

Transcription

Rapport bibliographique - Master Acoustique Marseille
Effets de distance au casque
Rapport bibliographique
Thomas Joubaud
Sous la direction de Christophe Lambourg
(Genesis)
Stage Master II « Mécanique, Physique et Ingénierie »
Spécialité « Acoustique », LMA
Laboratoire de Mécanique
Genesis
et d’Acoustique
Domaine du petit Arbois
31 chemin Joseph Aiguier
BP 69
13402 Marseille Cedex 20
13545 Aix en Provence Cedex 4
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 2 / 23
Table des matières
Introduction ............................................................................... 3
I- Head Related Transfer Functions (HRTF) ................................ 4
A) Mesures des HRTF
4
B) Indices de localisation
6
i) La différence interaurale de temps (ITD) ............................................................ 6
ii) La différence interaurale d’intensité (ILD) .......................................................... 6
iii) Les indices spectraux ..................................................................................... 7
iv) Les indices de distance ................................................................................... 8
II- Déroulement du stage ........................................................... 9
A) Objectifs
9
B) Démarche
9
III- Holographie acoustique en champ proche (NAH) .............. 11
A) En coordonnées cartésiennes
12
i) Transformée de Fourier .................................................................................. 12
ii) Equation d’onde ........................................................................................... 12
iii) Spectre angulaire : Acoustique de Fourier ....................................................... 13
iv) Extrapolation du champ de pression suivant z ................................................. 14
v) Problème réel de NAH ................................................................................... 14
B) En coordonnées sphériques
17
i) Equation d’onde ............................................................................................ 17
ii) Holographie acoustique sphérique ................................................................... 18
IV- Méthode de régularisation .................................................. 19
A) Décomposition en valeurs singulières (SVD)
19
B) Régularisation de Tikhonov
20
Bibliographie ............................................................................ 22
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 3 / 23
Introduction
Genesis est une société d’ingénierie acoustique basée à Aix en Provence. Elle réalise des
études et des logiciels dans les domaines de la simulation et de la perception des
environnements sonores (psychoacoustique, simulateurs audio 3D et temps-réel, design
sonore, traitement du signal…) pour l’automobile, l’aéronautique et d’autres secteurs
L’Homme possède l’incroyable capacité de pouvoir localiser une source sonore dans un
espace à trois dimensions avec une précision d’environ 5° en azimut et en élévation, dans
des environnements bruités. La localisation spatiale se base sur de multiples indices
contenus dans les fonctions de transfert qui caractérisent les transformations subies par
une onde acoustique entre le point source et les deux oreilles de l’auditeur, que l’on appelle
les « Head Related Transfer Functions » (HRTF). La synthèse binaurale permet de simuler
au casque l’écoute spatialisée de sources sonores situées autour de l’auditeur en filtrant le
signal émis à l’aide des HRTF.
En général, les HRTF sont mesurées sur une seule sphère centrée sur la tête de l’auditeur,
donc à une unique distance de l’auditeur. Le but de ce stage est de prendre en compte des
effets de distance pour la restitution sonore 3D au casque d’écoute stéréo (écoute
binaurale), c'est-à-dire d’extrapoler les HRTF sur d’autres sphères pour simuler l’effet de
distance.
Ce rapport bibliographique a pour but de présenter l’état actuel de l’art sur l’extrapolation
des HRTF. Dans un premier temps, les HRTF, les indices de localisation et les moyens
existants pour les mesurer seront présentés, puis la démarche utilisée au cours du stage
sera décrite. Ensuite la méthode d’holographie acoustique sera développée. Dans la
quatrième partie seront décrites plusieurs méthodes de régularisation de solution de
problème mal posé.
Effets de distance au casque
I- Head Related Transfer Functions (HRTF)
Rapport bibliographique
06 Mai 2013
Page 4 / 23
(1)
La synthèse binaurale a pour objectif de reproduire et de contrôler la sensation de
localisation du son pour une restitution au casque d’écoute. Le principe est représenté sur
la figure ci-dessous.
Figure 1: Mesure des fonctions de transfert Hdroite et Hgauche aux oreilles de l’auditeur (figure de gauche) et restitution
du son spatialisé au casque d’écoute par filtrage avec les fonctions de transfert mesurées (figure de droite)
Le traitement fait intervenir deux filtres spécifiques à chaque position de source, qui
prennent en compte les transformations auxquelles le son est sujet lorsqu’il rencontre le
torse, la tête et les oreilles de l’auditeur. Ces filtres sont appelés les Head Related Transfer
Functions que nous noterons HRTF dans la suite.
A) Mesures des HRTF
Les HRTF dépendent de la physiologie de l’auditeur et sont propres à chaque personne. Il
n’existe donc pas d’HRTF génériques qui seraient bien adaptées à tous les auditeurs. L’idéal
reste d’utiliser des HRTF mesurées. Différents protocoles de mesure sont présentés dans
[1], [2] et [3]. On remarque que deux approches sont possibles :

Mesure directe : on mesure les fonctions de transfert entre le signal émis par un
haut-parleur à un point d’une sphère centrée sur la tête de l’auditeur et le signal reçu
par les microphones placés dans les oreilles de l’auditeur. Bien que cette méthode
représente la réalité de la perception sonore et que sa mise en œuvre est courante,
elle nécessite beaucoup de positions de mesure et prend donc beaucoup de temps
pendant lequel l’auditeur ne doit pas bouger.

Par réciprocité (méthode utilisée par l’IRCAM) : on échange les positions des
microphones et des haut-parleurs de la mesure directe décrite ci-dessus. De cette
manière, la mesure est beaucoup plus rapide puisqu’on peut utiliser des antennes de
microphones et donc réaliser les mesures pour plusieurs positions en une seule fois.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 5 / 23
Cependant, l’efficacité des haut-parleurs en basses fréquences est limitée à cause de
leur petite taille (pour qu’ils puissent rentrer dans le conduit auditif de l’auditeur).
Dans [4], l’HRTF à chaque fréquence à une oreille est définie comme le rapport entre les
transformées de Fourier temporelle du signal reçu par le tympan Φl,r (l et r désignent
respectivement la gauche et la droite) et du signal reçu au centre de la tête en champ libre
(en absence de l’auditeur) Φf :
(1.1)
Où ω est la pulsation, φ et θ sont respectivement l’azimut et l’élévation. Le système de
coordonnées sphériques représenté ci-dessous est utilisé.
Figure 2: Définition du système de coordonnées
Les HRTF contiennent les indices de localisation, qui sont utilisés par le système auditif pour
localiser les sources sonores dans l’espace. Nous allons voir que ces indices peuvent être
propre à chaque oreille ou au contraire dépendre des différences entre les signaux reçus à
chaque oreille.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 6 / 23
B) Indices de localisation
Il existe plusieurs types d’indices acoustiques complémentaires utilisés par le système
auditif pour la localisation :
i) La différence interaurale de temps (ITD)
L’ITD représente les décalages temporels observés entre les signaux parvenant aux oreilles.
En effet, si la source est sur le côté de la tête, l’onde sonore arrive à l’oreille opposée avec
une différence de marche. La différence interaurale de temps dépend donc de l’azimut de la
source. En fonction de la fréquence étudiée, on peut utiliser deux descriptions de cet indice
[2].
En basse fréquence (f < 1500Hz), l’ITD représente le retard de phase entre les signaux
droite et gauche :
(1.2)
Il permet la localisation des signaux quelconques (stationnaires ou non) jusqu’à 1.5kHz.
Pour des fréquences supérieures, le système auditif utilise cette fois le retard d’enveloppe
entre les signaux droite et gauche. On peut donc calculer le retard de groupe :
(1.3)
Le retard d’enveloppe permet la localisation sur tout le spectre des signaux non
stationnaires uniquement (on ne peut pas calculer de retard d’enveloppe pour des signaux
stationnaires).
ii) La différence interaurale d’intensité (ILD)
Dans [5], l’ILD est donnée par le rapport des énergies moyennes des HRTF sur une bande
de fréquence donnée pour laquelle l’ILD est un indice prépondérant (entre 1 et 5kHz) :
(1.4)
Où F est le nombre d’échantillons fréquentiels. Si la source est en champ lointain (distance
supérieure à 1m), les ILD sont dues à un effet d’ombre acoustique par la tête qui se produit
si la longueur d’onde du signal est inférieure au diamètre de la tête (~20cm), c'est-à-dire à
hautes fréquences. En champ proche, les ILD existent aussi à basses fréquences et
augmentent lorsque la distance entre la source et la tête diminue [6].
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 7 / 23
On peut remarquer que les différences interaurales de temps et d’intensité sont des indices
provenant des différences entre les HRTF des deux oreilles : ce sont des indices binauraux.
Ils permettent la localisation à un cône d’incertitude près (cône de confusion) représenté
sur la figure ci-dessous, dont la première conséquence est l’ambiguïté avant/arrière pour
les sources situées dans le plan médian. Enfin, en champ lointain (longueur d’onde et
dimensions de la tête petites devant la distance source-tête), ces indices ne dépendent pas
de la distance source-tête.
Figure 3: Cônes de confusion
iii) Les indices spectraux
A partir de 3kHz, le pavillon auditif agit comme un ensemble de résonateurs et de
réflecteurs. Les résonances et les retards dus aux réflexions obtenus dépendent des
caractéristiques spatiales du champ acoustique, conditionnées par la position de la source.
Ces indices permettent les discriminations haut/bas et avant/arrière et la résolution de
l’élévation. Enfin, on remarque que les indices spectraux sont cette fois des indices
monauraux. Ils dépendent d’autre part très fortement des détails physiologiques de
l’auditeur, et sont donc très différents d’une personne à l’autre. Ces écarts interindividuels
expliquent la raison pour laquelle il n’existe pas d’HRTF généralisées adaptées à tous les
auditeurs.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 8 / 23
iv) Les indices de distance
En champ libre, quand la distance entre une source sonore et la tête d’un auditeur
augmente, il y a diminution de l’intensité et diminution de l’énergie dans les aigües. Donc
plus le signal est faible, plus la distance perçue est grande, et plus le signal est pauvre en
aigües, plus la distance perçue est grande.
En champ réverbérant, c’est le rapport de l’énergie directe sur l’énergie indirecte qui
diminue quand la distance augmente.
En champ proche, nous avons déjà vu que l’ILD augmente quand la distance diminue.
Les HRTF sont mesurées uniquement sur une sphère de rayon de l’ordre d’un mètre centrée
sur la tête de l’auditeur. Comme indiqué dans [7], l’obtention d’HRTF sur des sujets réels
peut représenter plusieurs centaines de mesures sur une seule sphère, et donc plusieurs
heures pendant lesquelles le sujet ne doit pas bouger. Il est donc inenvisageable de
mesurer les HRTF à différentes distances et l’augmentation de la résolution angulaire sur
une seule sphère paraît limitée. D’où l’idée de réaliser une extrapolation des HRTF pour des
rayons différents. La section suivante décrit le déroulement de la suite de mon stage, dont
le but sera d’utiliser le principe de réciprocité et la méthode d’holographie acoustique.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 9 / 23
II- Déroulement du stage
(2)
A) Objectifs
Pour la synthèse binaurale, les HRTF doivent être connues pour chaque position (r,θ,φ) des
sources que l’on souhaite modéliser. Dans la pratique, elles sont généralement mesurées
pour des positions angulaires discrètes situées à égale distance du centre de la tête, les
HRTF intermédiaires étant obtenues par interpolation. L’effet de la distance entre la source
et l’auditeur est généralement pris en compte sous la forme d’une atténuation en 1/r. Cette
approche est satisfaisante en champ lointain (distance grande devant la longueur d’onde
acoustique), mais ne donne pas de bons résultats pour simuler des sources à faible distance
de l’auditeur. L’objectif du stage est d’implémenter et de valider une nouvelle méthode
d’extrapolation des HRTF pour simuler l’effet de distance.
B) Démarche
En me basant sur la méthode d’holographie acoustique en coordonnées sphériques, sur les
techniques d’intégration numériques sur la sphère et sur les méthodes de régularisation, je
suivrai la démarche présentée dans [3], [7] et [8]. Le son provenant de la source primaire
(haut-parleur) est diffusé par le corps et la tête de l’auditeur et crée alors des sources
secondaires à la surface de la tête et du corps, or les techniques d’holographie acoustique
sont basées sur la formulation d’un problème extérieur (étude du champ acoustique à
l’extérieur d’un volume fini contenant toutes les sources). Pour se ramener à ce type de
problème, on utilise le théorème de réciprocité. Celui-ci stipule que la pression générée en
un point A par une source située en un autre point B est identique à la pression qui serait
générée au point B par la source située en A. On peut donc définir les HRTF comme les
fonctions de transfert entre une source située à l’oreille de l’auditeur et les récepteurs
positionnés sur la sphère de mesure. On pourra alors résoudre l’équation d’onde pour le
problème extérieur décrit en Figure 4.
Figure 4: Géométrie de la mesure d'HRTF basée sur le principe de réciprocité [7]
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 10 / 23
Le principe consiste à décomposer le champ de pression mesuré à des points discrets de la
sphère sur une base d’harmoniques sphériques, puis à propager (augmentation de r) ou
rétro-propager (diminution de r) chacune des composantes par multiplication par un
facteur, pour en déduire les HRTF à des distances quelconques de la tête. La mesure sur la
sphère étant discrète, la décomposition en harmoniques sphériques [3] ou en série de
Fourier-Bessel sphérique [7] devrait nous permettre d’obtenir une représentation continue
des HRTF dans l’espace autour de l’auditeur.
Au moment de l’écriture de ce rapport, la période de recherche bibliographique touche à sa
fin. Je serai ensuite amener à développer un modèle d’extrapolation des HRTF puis à écrire
sous Matlab des routines permettant d’extrapoler des HRTF à une distance quelconque de
l’auditeur à partir d’un jeu d’HRTF mesuré à une distance fixe. Ces routines seront alors
comparées avec des calculs analytiques obtenus pour des modèles simplifiés de tête [9]
(disponibles chez Genesis). Si la méthode d’extrapolation s’avère satisfaisante et si le
temps me le permet, je pourrai également participer à l’implémentation de la méthode sur
la plateforme de simulation en temps réel de Genesis.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 11 / 23
III- Holographie acoustique en champ proche (NAH)
Le but principal est de reconstruire la pression ou la vitesse acoustique (ou les HRTF dans
notre cas) en tout point de l’espace à partir d’un nombre fini de points de mesure. La
théorie est décrite de manière très complète dans [10]. Ce chapitre résume cette théorie
tout d’abord dans un système de coordonnées cartésiennes, car les développements
analytiques sont plus simples dans ce cas et ils nous permettront de bien saisir les enjeux
de l’holographie acoustique. Ensuite, la méthode sera appliquée dans un système de
coordonnées sphériques puisqu’il sera aussi utilisé dans le cadre de l’étude des HRTF en
raison de la symétrie sphérique de la tête.
Le principe général de la méthode peut être décomposé en quatre étapes :
1. Mesure du champ acoustique sur une surface adaptée à la géométrie des sources,
comme indiqué sur les figures ci-dessous.
Figure 5: Si toutes les sources sont dans le semi-espace z ≤ zs, on mesure le champ acoustique sur un plan
n’appartenant pas à ce semi-espace.
Figure 6: Le champ acoustique est mesuré sur une sphère de rayon r0. A gauche, problème intérieur, toutes les
sources sont incluses dans une sphère de rayon a ; à droite, problème extérieur, toutes les sources sont à
l’extérieur d’une sphère de rayon a.
(3)
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 12 / 23
2. Calcul de la transformée de Fourier spatiale (en cartésien ou en sphérique) du champ
acoustique mesuré.
3. Interpolation du champ dans le domaine de Fourier : multiplication par un terme
propagateur pour obtenir la transformée de Fourier spatiale du champ acoustique sur
un autre plan z≥zs (dans le cas de la Figure 5) ou une autre sphère de rayon r≥a
(Figure 6 gauche) ou r≤a (Figure 6 droite).
4. Transformée de Fourier inverse pour repasser dans le domaine spatial.
Si la surface sur laquelle on calcule le champ acoustique est plus éloignée des sources
que la surface de mesure, l’holographie acoustique résout un problème de propagation
directe. Dans le cas contraire, on a affaire à un problème de rétro-propagation.
A) En coordonnées cartésiennes
i) Transformée de Fourier
La transformée de Fourier temporelle et sa transformée inverse sont définies dans toute la
suite de ce rapport par :
De la même manière, les transformées de Fourier spatiales directes et inverses sont
définies comme suit :
ii) Equation d’onde
Considérons p(x,y,z,t) une petite variation de pression acoustique autour de l’équilibre (la
pression atmosphérique par exemple). Cette variation de pression satisfait l’équation
d’onde en champ libre:
(3.1)
Où c est la célérité du son dans le milieu (à 20°C, c=343 m/s dans l’air, et c=1481 m/s
dans l’eau) et
est l’opérateur laplacien qui, en coordonnées cartésiennes, est :
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 13 / 23
En étudiant la transformée de Fourier de l’équation d’onde, on obtient l’équation de
Helmholtz :
(3.2)
Avec
le nombre d’onde. Pour simplifier la notation, la transformée de Fourier de p a
aussi été notée p.
La solution générale de l’équation (3.2) en trois dimensions peut être mise sous la forme
d’une somme continue d’ondes planes :
(3.3)
Les trois composantes ki du vecteur d’onde ne sont pas indépendantes et satisfont :
(3.4)
On peut donc par exemple choisir kx et ky indépendants (exemple gardé dans la suite) et :
Et l’expression de p devient :
(3.5)
iii) Spectre angulaire : Acoustique de Fourier
On suppose par la suite que toutes les sources sont localisées dans le demi-espace z < 0.
Si l’on observe l’évolution des composantes du champ de pression avec z dans l’équation
(3.5), on peut distinguer :

Les composantes évanescentes, qui correspondent à kz imaginaire, et pour lesquelles
l’amplitude varie exponentiellement avec z

Les composantes propagatives, associées à kz réel, dont l’amplitude ne varie pas
avec z.
Le terme
est ajouté de façon à ce que si l’on se place dans le plan z=0, on reconnaît une
transformée de Fourier inverse. P(kx,ky) est appelé le spectre angulaire et est donné par :
(3.6)
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 14 / 23
iv) Extrapolation du champ de pression suivant z
La connaissance du spectre angulaire est possible à partir du moment où l’on connaît la
pression acoustique dans le plan z=0. Nous allons à présent voir qu’à partir de ce spectre
P(kx, ky), on peut calculer la pression en n’importe quel point du demi-espace z > 0.
Il est démontré dans [10] que la transformée de Fourier suivant x et y de la pression dans
un plan z quelconque (que l’on écrit P(kx,ky,z)) est donnée par la relation :
De là l’expression générale de l’extrapolation du spectre angulaire calculé sur un plan z=zh
vers un plan z=z :
(3.7)
La partie exponentielle du terme de droite est appelée propagateur.
Finalement, si l’on connaît le champ de pression sur un plan z=zh, on peut calculer le champ
de pression en tout plan z=z en réalisant la transformée de Fourier inverse de l’équation
(3.7).
(3.8)
En conclusion, si toutes les sources acoustiques sont confinées dans le semi-espace z<zs et
si la pression est connue sur un plan z=zh≥zs, alors le spectre angulaire de la pression sur
un autre plan z≥zs est donné par l’équation (3.8).
L’extrapolation du champ de pression sur n’importe quel autre point du semi-espace z≥zs
en utilisant la décomposition en ondes planes (équation (3.5)) s’appelle l’holographie
acoustique en coordonnées cartésiennes. Le fait de prendre en compte le champ
évanescent définit l’holographie acoustique en champ proche (NAH), et permet d’accéder à
une meilleure résolution qu’avec la méthode d’holographie classique (résolution maximale :
λ/2 où λ est la longueur d’onde).
v) Problème réel de NAH
Dans la pratique, un certain nombre de problème se posent lors de la mise en œuvre de la
méthode NAH. Ceux-ci sont de trois ordres :

Influence du bruit de mesure

Influence de la fenêtre spatiale de mesure (taille de l’antenne)

Influence de la discrétisation spatiale (espacement entre les microphones)
Effets de distance au casque
III.A.v.1
Rapport bibliographique
06 Mai 2013
Page 15 / 23
Influence du bruit de mesure
Reprenons l’équation (3.8) et considérons que nous sommes dans le cadre du problème de
rétro-propagation (z<zh). On remarque alors que pour les ondes évanescentes (pour
kx2+ky2 > k2), le propagateur a une croissance exponentielle. Or, dans un problème
expérimental, la pression dans le plan z=zh est mesurée expérimentalement. Il y a donc un
risque que du bruit ε perturbe la mesure et qu’il soit fortement amplifié par la multiplication
avec le propagateur dans le domaine de Fourier. Dans la théorie, on suppose que ce bruit
est non corrélé (bruit blanc).
La partie 3.4 de [10] décrit les effets de l’ajout du bruit sur la rétro-propagation. Une
solution à ce problème de bruit est de filtrer la pression mesurée dans l’espace des nombres
d’onde pour limiter l’influence des hautes valeurs de kx et ky. Le filtrage basique consiste à
annuler le spectre angulaire de la pression mesurée dès que kx2+ky2 est supérieur à une
valeur critique kc2. Ceci revient à le multiplier par une fonction porte et donc à le convoluer
dans l’espace (x,y) par un sinus cardinal. Pour limiter les oscillations parasites dues à cette
convolution, il convient de modifier la forme du filtre. En traitement holographique, la
fenêtre couramment utilisée est de la forme:
(3.9)
Il s’agit en fait d’une fonction porte dont les discontinuités ont été « adoucies ». Cet
adoucissement est contrôlé par le paramètre . Plus ce paramètre est grand, plus la
fonction porte est arrondie. La détermination de la valeur critique kc optimale est décrite
dans [10].
III.A.v.2
Influence du fenêtrage spatial
En plus du bruit, il existe d’autres sources d’erreur dans l’estimation de la solution du
problème inverse. Tout d’abord, la théorie prévoit que la pression mesurée doit l’être sur un
plan entier (donc infini), ce qui n’est pas du tout réalisable expérimentalement. En réalité,
la pression est mesurée sur une certaine fenêtre (Lx,Ly) du plan z=zh. En pratique, on
choisit la taille de la fenêtre au moins deux fois supérieure à celle des sources. Le choix de
la fenêtre est encore une fois primordial pour limiter l’influence de la fenêtre spatiale sur les
résultats du problème inverse. La fenêtre proposée par Williams dans [10] est la fenêtre de
Tukey à 8 points.
Effets de distance au casque
III.A.v.3
Rapport bibliographique
06 Mai 2013
Page 16 / 23
Influence de la discrétisation spatiale
Ensuite, une mesure continue sur la fenêtre est impossible. La pression mesurée est donc
discrétisée en espace et en temps, ce qui limite notre résolution fréquentielle et spatiale.
L’échantillonnage en espace induit un recouvrement dans le calcul de la transformée de
Fourier. Le théorème d’échantillonnage stipule que la distance (ou le temps) entre deux
échantillons doit être inférieure à la moitié de la plus petite longueur d’onde (ou période)
que l’on souhaite étudier.
Pour finir, le fait d’avoir des données discrètes implique l’utilisation de la transformée de
Fourier discrète.
Ayant vu les principes de la NAH en coordonnées cartésiennes et les problématiques
engendrées, on peut maintenant passer en coordonnées sphériques.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 17 / 23
B) En coordonnées sphériques
i) Equation d’onde
Un repère en coordonnées sphériques est défini sur la figure suivante.
Figure 7: Repère en coordonnées sphériques
La pression acoustique satisfait toujours l’équation d’onde (3.1) sauf qu’à présent le
laplacien s’écrit :
Dans le cas d’un problème extérieur, c'est-à-dire que la sphère d’étude contient toutes les
sources, la solution de l’équation d’onde sortante en coordonnées sphériques peut être
décomposée en somme infinie de modes spatiaux (produits de fonctions à variables
séparées en r, θ, φ) :
(3.10)
Où Ynm est l’harmonique sphérique de degré n et d’ordre m (solution de l’équation de
Laplace en coordonnées sphériques) qui s’exprime à l’aide des fonctions de Legendre
associées :
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 18 / 23
Pmn(r) est appelé le spectre d’onde sphérique de la pression p. Si la pression est connue sur
une sphère de rayon r0, [10] montre que le spectre d’onde sphérique de la pression sur une
sphère de rayon r peut s’écrire :
(3.11)
Où hn est la fonction de Hankel sphérique de première espèce de degré n. L’équation (3.11)
permet d’extrapoler la pression sur toute sphère contenant les sources acoustiques.
ii) Holographie acoustique sphérique
Le principe restant le même que celui de la NAH en coordonnées cartésiennes, l’holographie
acoustique sphérique est similaire à l’holographie en coordonnées cartésiennes, sauf que la
transformée de Fourier spatiale est « remplacée » par la décomposition en harmoniques
sphériques. Les problématiques rencontrées dans la partie (II-A) sont donc les mêmes,
c'est-à-dire la prise en compte du bruit de mesure, de la discrétisation de la sphère de
mesure et du fait que la décomposition décrite comme une somme infinie dans l’équation
(3.10) ne pourra pas être infinie.
L’holographie sphérique se distingue tout de même de l’holographie plane par le fait qu’elle
n’est pas sujette au biais introduit par le fenêtrage spatiale car la sphère est une surface
fermée. Toutefois, comme on ne sait pas discrétiser régulièrement une sphère, la
détermination du spectre d’onde sphérique sera souvent posé comme un problème mal
conditionné. C’est pourquoi il est à présent utile de s’intéresser au problème de
régularisation de solution de problème mal-posé.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 19 / 23
IV- Méthode de régularisation
(4)
Les problèmes numériques rencontrés lors de l’interpolation d’HRTF qui nécessitent une
régularisation de la solution peuvent être mis sous la forme :
où b est le vecteur qui contient la pression mesurée sur les M points de la sphère (donnée
bruitée), x le vecteur qui contient les pondérations des N harmoniques sphériques
(inconnues) et A la matrice de taille M*N qui contient l’expression des N harmoniques
sphériques pour les N points de mesure (donnée non-bruitée). En général on a M>N. Le but
est de réussir à bien estimer x connaissant b dans le cas où la mesure est corrompue par
un bruit e :
La solution au sens des moindres carrés de ce système est donnée par
, où A+ est
la pseudo-inverse (de Moore-Penrose) de A. Toutefois, dans le cas de la rétro-propagation,
la matrice A sera mal conditionnée et l’amplitude de la solution au sens des moindres carrés
sera très dépendante de l’amplitude du bruit de mesure.
Afin de mettre en évidence ces effets et de trouver des moyens pour les contrer, nous
allons avoir besoin de la décomposition en valeurs singulières.
A) Décomposition en valeurs singulières (SVD)
Etant donnée une matrice
factorisation de A sous la forme :
, une décomposition en valeurs singulières de A est une
(4.1)
Telle que U est une matrice carrée orthogonale de taille M*M dont les colonnes sont les
vecteurs singuliers à gauche de A, V est une matrice orthogonale de taille N*N dont les
colonnes sont les vecteurs singuliers à droite de A et ∑ est une matrice de taille M*N de la
forme :
telle que les σi sont les valeurs singulières de A et sont rangées dans l’ordre :
Le conditionnement de A est représenté par le nombre σ1/σN. Ce nombre restera
convenable dans le cas de la propagation, mais en rétro-propagation, il pourra devenir trop
grand.
Effets de distance au casque
La pseudo-inverse de A est déduite de l’équation (4.1) :
Rapport bibliographique
06 Mai 2013
Page 20 / 23
avec :
La forme de la pseudo-inverse de ∑ permet de montrer que le bruit de mesure est surtout
amplifié par les petites valeurs singulières de A si on résout le système au sens des
moindres carrés. L’idée de base pour régulariser la solution est d’éliminer (d’annuler) un
certain nombre de petites valeurs singulières [11]. Cette méthode peut être comparée au
filtrage des grands nombres d’onde de la partie (III-A-v-1). Cependant, comme dans cette
partie, l’annulation brutale de plusieurs valeurs singulières va avoir des effets indésirables.
On cherche donc à réguler l’amplification du bruit de manière plus « douce », par exemple
en appliquant une régularisation de Tikhonov.
B) Régularisation de Tikhonov
La résolution du problème au sens des moindres carrés revient à minimiser une fonction
coût correspondant à la norme euclidienne du résidu :
Le principe de la régularisation de Tikhonov est, plutôt que de minimiser simplement la
somme des carrés de l’erreur, de minimiser une fonction coût qui pénalise aussi l’amplitude
de la solution :
(4.2)
où λ est un paramètre de régularisation. La solution qui minimise cette nouvelle fonction
coût est :
Avec :
Le paramètre de régularisation λ réduit l’influence des
correspondants aux petites valeurs singulières. Le choix
observations faites dans [12] : d’un côté s’il est trop grand,
solution sera trop grande, de l’autre s’il est trop petit, la
contributions des erreurs de données.
coefficients de cette matrice
de λ prend en compte deux
l’erreur de reconstruction de la
solution sera dominée par les
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 21 / 23
La détermination du paramètre de régularisation peut se faire suivant plusieurs méthodes.
Les méthodes de validation croisée ordinaire et généralisée sont présentées dans [13]. La
validation croisée ordinaire consiste à rechercher la solution des sous-problèmes
correspondants au cas où une donnée a été « oubliée » puis à recalculer cette donnée en
utilisant le résultat. La solution du problème initial est celle qui minimise les erreurs entre
les données mesurées et reconstruites. Seulement cette méthode peut avoir de mauvais
résultat, en particulier si les solutions des sous-problèmes mentionnés sont indépendantes
de λ. La validation croisée généralisée permet de s’affranchir de ces problèmes en posant
que tout bon choix de λ doit être invariant par rotation du système de coordonnées de
mesure.
Une autre méthode présentée dans [12] et [14] utilise une L-curve (courbe en L), c'est-àdire une courbe en échelle log-log représentant la norme d’une solution régularisée par
rapport à la norme du résiduel correspondant.
Figure 8: Forme générale d'une courbe en L
La figure ci-dessus présente la forme générale d’une courbe en L. Le paramètre de
régularisation optimal λlim se trouve à l’angle du L, c'est-à-dire au point de courbure
maximale de la courbe en L. En effet, pour λ<λlim, l’amplitude de la solution augmente
fortement sans réduction notable du résiduel alors que pour λ>λlim, la norme du résiduel
augmente fortement sans pour autant que l’amplitude de la solution augmente.
Une méthode du même genre, utilisant une courbe en U est présentée dans [15].
Pour finir, d’autres méthodes sont, en plus de celles présentées précédemment,
implémentées dans le package Matlab « Regularization Tools » de Per Christian Hansen et
décrites dans le manuel de ce package [16].
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 22 / 23
Bibliographie
[1] K.-V. Nguyen, T. Carpentier, M. Noisternig et O. Warusfel, «Calculation of Head
Related Transfer Functions in the proximity region using spherical harmonics
decomposition: Comparison with measurements and evaluation,» chez Proc. of the 2nd
International Symposium on Ambisonics and Spherical Acoustics, 2010.
[2] V. Larcher, «Techniques de spatialisation des sons pour la réalité virtuelle,» Thèse de
doctorat de l'université de Paris VI, 2001.
[3] M. J. Evans, J. A. S. Angus et A. I. Tew, «Analysing head-related transfer function
measurements using surface spherical harmonics,» J. Acoust. Soc. Am., pp. 24002411, 1998.
[4] D. N. Zotkin, R. Duraiswami et L. S. Davis, «Creation of virtual auditory spaces,» chez
International Conference on Acoustics, Speech and Signal Processing, 2002.
[5] N. Epain, P. Guillon, A. Kan, R. Kosobrodov, D. Sun, C. Jin et A. Van Schaik,
«Objective evaluation of a three-dimensional sound field reproduction system,» chez
20th International Congress on Acoustics, Sydney, 2010.
[6] S. Savel, Perception de l'espace sonore, Cours Master2 MPI - Spécialité Acoustique,
LMA, 2013.
[7] W. Zhang, T. D. Abhayapala, R. A. Kennedy and R. Duraiswami, "Insights into Head
Related Transfer Function: Spatial Dimensionality and Continuous Representation," J.
Acoust. Soc. Am., pp. 2347-2357, 2010.
[8] R. Duraiswami, D. N. Zotkin et N. A. Gumerov, «Interpolation and range extrapolation
of HRTFs,» 2004.
[9] R. O. Duda et W. L. Martens, «Range dependence of the response of a spherical head
model,» J. Acoust. Soc. Am., vol. 104, n° 15, pp. 3048-3058, 1998.
[10] E. G. Williams, Fourier Acoustics: Sound Radiation and Nearfield Acoustical
Holography, Naval Research Laboratory, Washington, D.C.: Academic Press, 1999.
[11] P. A. Nelson et S. H. Yoon, «Estimation of acoustic source strength by inverse
methods: Part I, Conditioning of the inverse problem,» Journal of Sound and Vibration,
pp. 643-668, 2000.
[12] P. C. Hansen, «The L-curve and its use in the numerical treatment of inverse
problems,» Computanional Inverse Problems in Electrocardiology, pp. 119-142, 2001.
[13] S. H. Yoon et P. A. Nelson, «Estimation of acoustic source strength by inverse
methods: Part II, Experimental investigation of methods for choosing regularization
parameters,» Journal of Sound and Vibration, pp. 669-705, 2000.
Effets de distance au casque
Rapport bibliographique
06 Mai 2013
Page 23 / 23
[14] D. Calvetti, S. Morigi, L. Reichel et F. Sgallari, «Tickonov regularization and the L-curve
for large discrete ill-posed problems,» Journal of Computanional and Applied
Mathematics, pp. 423-446, 2000.
[15] D. Krawczyk-Stando et M. Rudnicki, «Regularization parameter selection in discrete illposed problems - the use of the U-curve,» Int. J. Appl. Math. Comput. Sci., vol. 17,
n° 12, pp. 157-164, 2007.
[16] P. C. Hansen, Regularization Tools: A Matlab package for analysis and solution of
discrete ill-posed problems, Lyngby, 2008.

Documents pareils