Rapport bibliographique - Master Acoustique Marseille
Transcription
Rapport bibliographique - Master Acoustique Marseille
Effets de distance au casque Rapport bibliographique Thomas Joubaud Sous la direction de Christophe Lambourg (Genesis) Stage Master II « Mécanique, Physique et Ingénierie » Spécialité « Acoustique », LMA Laboratoire de Mécanique Genesis et d’Acoustique Domaine du petit Arbois 31 chemin Joseph Aiguier BP 69 13402 Marseille Cedex 20 13545 Aix en Provence Cedex 4 Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 2 / 23 Table des matières Introduction ............................................................................... 3 I- Head Related Transfer Functions (HRTF) ................................ 4 A) Mesures des HRTF 4 B) Indices de localisation 6 i) La différence interaurale de temps (ITD) ............................................................ 6 ii) La différence interaurale d’intensité (ILD) .......................................................... 6 iii) Les indices spectraux ..................................................................................... 7 iv) Les indices de distance ................................................................................... 8 II- Déroulement du stage ........................................................... 9 A) Objectifs 9 B) Démarche 9 III- Holographie acoustique en champ proche (NAH) .............. 11 A) En coordonnées cartésiennes 12 i) Transformée de Fourier .................................................................................. 12 ii) Equation d’onde ........................................................................................... 12 iii) Spectre angulaire : Acoustique de Fourier ....................................................... 13 iv) Extrapolation du champ de pression suivant z ................................................. 14 v) Problème réel de NAH ................................................................................... 14 B) En coordonnées sphériques 17 i) Equation d’onde ............................................................................................ 17 ii) Holographie acoustique sphérique ................................................................... 18 IV- Méthode de régularisation .................................................. 19 A) Décomposition en valeurs singulières (SVD) 19 B) Régularisation de Tikhonov 20 Bibliographie ............................................................................ 22 Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 3 / 23 Introduction Genesis est une société d’ingénierie acoustique basée à Aix en Provence. Elle réalise des études et des logiciels dans les domaines de la simulation et de la perception des environnements sonores (psychoacoustique, simulateurs audio 3D et temps-réel, design sonore, traitement du signal…) pour l’automobile, l’aéronautique et d’autres secteurs L’Homme possède l’incroyable capacité de pouvoir localiser une source sonore dans un espace à trois dimensions avec une précision d’environ 5° en azimut et en élévation, dans des environnements bruités. La localisation spatiale se base sur de multiples indices contenus dans les fonctions de transfert qui caractérisent les transformations subies par une onde acoustique entre le point source et les deux oreilles de l’auditeur, que l’on appelle les « Head Related Transfer Functions » (HRTF). La synthèse binaurale permet de simuler au casque l’écoute spatialisée de sources sonores situées autour de l’auditeur en filtrant le signal émis à l’aide des HRTF. En général, les HRTF sont mesurées sur une seule sphère centrée sur la tête de l’auditeur, donc à une unique distance de l’auditeur. Le but de ce stage est de prendre en compte des effets de distance pour la restitution sonore 3D au casque d’écoute stéréo (écoute binaurale), c'est-à-dire d’extrapoler les HRTF sur d’autres sphères pour simuler l’effet de distance. Ce rapport bibliographique a pour but de présenter l’état actuel de l’art sur l’extrapolation des HRTF. Dans un premier temps, les HRTF, les indices de localisation et les moyens existants pour les mesurer seront présentés, puis la démarche utilisée au cours du stage sera décrite. Ensuite la méthode d’holographie acoustique sera développée. Dans la quatrième partie seront décrites plusieurs méthodes de régularisation de solution de problème mal posé. Effets de distance au casque I- Head Related Transfer Functions (HRTF) Rapport bibliographique 06 Mai 2013 Page 4 / 23 (1) La synthèse binaurale a pour objectif de reproduire et de contrôler la sensation de localisation du son pour une restitution au casque d’écoute. Le principe est représenté sur la figure ci-dessous. Figure 1: Mesure des fonctions de transfert Hdroite et Hgauche aux oreilles de l’auditeur (figure de gauche) et restitution du son spatialisé au casque d’écoute par filtrage avec les fonctions de transfert mesurées (figure de droite) Le traitement fait intervenir deux filtres spécifiques à chaque position de source, qui prennent en compte les transformations auxquelles le son est sujet lorsqu’il rencontre le torse, la tête et les oreilles de l’auditeur. Ces filtres sont appelés les Head Related Transfer Functions que nous noterons HRTF dans la suite. A) Mesures des HRTF Les HRTF dépendent de la physiologie de l’auditeur et sont propres à chaque personne. Il n’existe donc pas d’HRTF génériques qui seraient bien adaptées à tous les auditeurs. L’idéal reste d’utiliser des HRTF mesurées. Différents protocoles de mesure sont présentés dans [1], [2] et [3]. On remarque que deux approches sont possibles : Mesure directe : on mesure les fonctions de transfert entre le signal émis par un haut-parleur à un point d’une sphère centrée sur la tête de l’auditeur et le signal reçu par les microphones placés dans les oreilles de l’auditeur. Bien que cette méthode représente la réalité de la perception sonore et que sa mise en œuvre est courante, elle nécessite beaucoup de positions de mesure et prend donc beaucoup de temps pendant lequel l’auditeur ne doit pas bouger. Par réciprocité (méthode utilisée par l’IRCAM) : on échange les positions des microphones et des haut-parleurs de la mesure directe décrite ci-dessus. De cette manière, la mesure est beaucoup plus rapide puisqu’on peut utiliser des antennes de microphones et donc réaliser les mesures pour plusieurs positions en une seule fois. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 5 / 23 Cependant, l’efficacité des haut-parleurs en basses fréquences est limitée à cause de leur petite taille (pour qu’ils puissent rentrer dans le conduit auditif de l’auditeur). Dans [4], l’HRTF à chaque fréquence à une oreille est définie comme le rapport entre les transformées de Fourier temporelle du signal reçu par le tympan Φl,r (l et r désignent respectivement la gauche et la droite) et du signal reçu au centre de la tête en champ libre (en absence de l’auditeur) Φf : (1.1) Où ω est la pulsation, φ et θ sont respectivement l’azimut et l’élévation. Le système de coordonnées sphériques représenté ci-dessous est utilisé. Figure 2: Définition du système de coordonnées Les HRTF contiennent les indices de localisation, qui sont utilisés par le système auditif pour localiser les sources sonores dans l’espace. Nous allons voir que ces indices peuvent être propre à chaque oreille ou au contraire dépendre des différences entre les signaux reçus à chaque oreille. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 6 / 23 B) Indices de localisation Il existe plusieurs types d’indices acoustiques complémentaires utilisés par le système auditif pour la localisation : i) La différence interaurale de temps (ITD) L’ITD représente les décalages temporels observés entre les signaux parvenant aux oreilles. En effet, si la source est sur le côté de la tête, l’onde sonore arrive à l’oreille opposée avec une différence de marche. La différence interaurale de temps dépend donc de l’azimut de la source. En fonction de la fréquence étudiée, on peut utiliser deux descriptions de cet indice [2]. En basse fréquence (f < 1500Hz), l’ITD représente le retard de phase entre les signaux droite et gauche : (1.2) Il permet la localisation des signaux quelconques (stationnaires ou non) jusqu’à 1.5kHz. Pour des fréquences supérieures, le système auditif utilise cette fois le retard d’enveloppe entre les signaux droite et gauche. On peut donc calculer le retard de groupe : (1.3) Le retard d’enveloppe permet la localisation sur tout le spectre des signaux non stationnaires uniquement (on ne peut pas calculer de retard d’enveloppe pour des signaux stationnaires). ii) La différence interaurale d’intensité (ILD) Dans [5], l’ILD est donnée par le rapport des énergies moyennes des HRTF sur une bande de fréquence donnée pour laquelle l’ILD est un indice prépondérant (entre 1 et 5kHz) : (1.4) Où F est le nombre d’échantillons fréquentiels. Si la source est en champ lointain (distance supérieure à 1m), les ILD sont dues à un effet d’ombre acoustique par la tête qui se produit si la longueur d’onde du signal est inférieure au diamètre de la tête (~20cm), c'est-à-dire à hautes fréquences. En champ proche, les ILD existent aussi à basses fréquences et augmentent lorsque la distance entre la source et la tête diminue [6]. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 7 / 23 On peut remarquer que les différences interaurales de temps et d’intensité sont des indices provenant des différences entre les HRTF des deux oreilles : ce sont des indices binauraux. Ils permettent la localisation à un cône d’incertitude près (cône de confusion) représenté sur la figure ci-dessous, dont la première conséquence est l’ambiguïté avant/arrière pour les sources situées dans le plan médian. Enfin, en champ lointain (longueur d’onde et dimensions de la tête petites devant la distance source-tête), ces indices ne dépendent pas de la distance source-tête. Figure 3: Cônes de confusion iii) Les indices spectraux A partir de 3kHz, le pavillon auditif agit comme un ensemble de résonateurs et de réflecteurs. Les résonances et les retards dus aux réflexions obtenus dépendent des caractéristiques spatiales du champ acoustique, conditionnées par la position de la source. Ces indices permettent les discriminations haut/bas et avant/arrière et la résolution de l’élévation. Enfin, on remarque que les indices spectraux sont cette fois des indices monauraux. Ils dépendent d’autre part très fortement des détails physiologiques de l’auditeur, et sont donc très différents d’une personne à l’autre. Ces écarts interindividuels expliquent la raison pour laquelle il n’existe pas d’HRTF généralisées adaptées à tous les auditeurs. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 8 / 23 iv) Les indices de distance En champ libre, quand la distance entre une source sonore et la tête d’un auditeur augmente, il y a diminution de l’intensité et diminution de l’énergie dans les aigües. Donc plus le signal est faible, plus la distance perçue est grande, et plus le signal est pauvre en aigües, plus la distance perçue est grande. En champ réverbérant, c’est le rapport de l’énergie directe sur l’énergie indirecte qui diminue quand la distance augmente. En champ proche, nous avons déjà vu que l’ILD augmente quand la distance diminue. Les HRTF sont mesurées uniquement sur une sphère de rayon de l’ordre d’un mètre centrée sur la tête de l’auditeur. Comme indiqué dans [7], l’obtention d’HRTF sur des sujets réels peut représenter plusieurs centaines de mesures sur une seule sphère, et donc plusieurs heures pendant lesquelles le sujet ne doit pas bouger. Il est donc inenvisageable de mesurer les HRTF à différentes distances et l’augmentation de la résolution angulaire sur une seule sphère paraît limitée. D’où l’idée de réaliser une extrapolation des HRTF pour des rayons différents. La section suivante décrit le déroulement de la suite de mon stage, dont le but sera d’utiliser le principe de réciprocité et la méthode d’holographie acoustique. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 9 / 23 II- Déroulement du stage (2) A) Objectifs Pour la synthèse binaurale, les HRTF doivent être connues pour chaque position (r,θ,φ) des sources que l’on souhaite modéliser. Dans la pratique, elles sont généralement mesurées pour des positions angulaires discrètes situées à égale distance du centre de la tête, les HRTF intermédiaires étant obtenues par interpolation. L’effet de la distance entre la source et l’auditeur est généralement pris en compte sous la forme d’une atténuation en 1/r. Cette approche est satisfaisante en champ lointain (distance grande devant la longueur d’onde acoustique), mais ne donne pas de bons résultats pour simuler des sources à faible distance de l’auditeur. L’objectif du stage est d’implémenter et de valider une nouvelle méthode d’extrapolation des HRTF pour simuler l’effet de distance. B) Démarche En me basant sur la méthode d’holographie acoustique en coordonnées sphériques, sur les techniques d’intégration numériques sur la sphère et sur les méthodes de régularisation, je suivrai la démarche présentée dans [3], [7] et [8]. Le son provenant de la source primaire (haut-parleur) est diffusé par le corps et la tête de l’auditeur et crée alors des sources secondaires à la surface de la tête et du corps, or les techniques d’holographie acoustique sont basées sur la formulation d’un problème extérieur (étude du champ acoustique à l’extérieur d’un volume fini contenant toutes les sources). Pour se ramener à ce type de problème, on utilise le théorème de réciprocité. Celui-ci stipule que la pression générée en un point A par une source située en un autre point B est identique à la pression qui serait générée au point B par la source située en A. On peut donc définir les HRTF comme les fonctions de transfert entre une source située à l’oreille de l’auditeur et les récepteurs positionnés sur la sphère de mesure. On pourra alors résoudre l’équation d’onde pour le problème extérieur décrit en Figure 4. Figure 4: Géométrie de la mesure d'HRTF basée sur le principe de réciprocité [7] Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 10 / 23 Le principe consiste à décomposer le champ de pression mesuré à des points discrets de la sphère sur une base d’harmoniques sphériques, puis à propager (augmentation de r) ou rétro-propager (diminution de r) chacune des composantes par multiplication par un facteur, pour en déduire les HRTF à des distances quelconques de la tête. La mesure sur la sphère étant discrète, la décomposition en harmoniques sphériques [3] ou en série de Fourier-Bessel sphérique [7] devrait nous permettre d’obtenir une représentation continue des HRTF dans l’espace autour de l’auditeur. Au moment de l’écriture de ce rapport, la période de recherche bibliographique touche à sa fin. Je serai ensuite amener à développer un modèle d’extrapolation des HRTF puis à écrire sous Matlab des routines permettant d’extrapoler des HRTF à une distance quelconque de l’auditeur à partir d’un jeu d’HRTF mesuré à une distance fixe. Ces routines seront alors comparées avec des calculs analytiques obtenus pour des modèles simplifiés de tête [9] (disponibles chez Genesis). Si la méthode d’extrapolation s’avère satisfaisante et si le temps me le permet, je pourrai également participer à l’implémentation de la méthode sur la plateforme de simulation en temps réel de Genesis. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 11 / 23 III- Holographie acoustique en champ proche (NAH) Le but principal est de reconstruire la pression ou la vitesse acoustique (ou les HRTF dans notre cas) en tout point de l’espace à partir d’un nombre fini de points de mesure. La théorie est décrite de manière très complète dans [10]. Ce chapitre résume cette théorie tout d’abord dans un système de coordonnées cartésiennes, car les développements analytiques sont plus simples dans ce cas et ils nous permettront de bien saisir les enjeux de l’holographie acoustique. Ensuite, la méthode sera appliquée dans un système de coordonnées sphériques puisqu’il sera aussi utilisé dans le cadre de l’étude des HRTF en raison de la symétrie sphérique de la tête. Le principe général de la méthode peut être décomposé en quatre étapes : 1. Mesure du champ acoustique sur une surface adaptée à la géométrie des sources, comme indiqué sur les figures ci-dessous. Figure 5: Si toutes les sources sont dans le semi-espace z ≤ zs, on mesure le champ acoustique sur un plan n’appartenant pas à ce semi-espace. Figure 6: Le champ acoustique est mesuré sur une sphère de rayon r0. A gauche, problème intérieur, toutes les sources sont incluses dans une sphère de rayon a ; à droite, problème extérieur, toutes les sources sont à l’extérieur d’une sphère de rayon a. (3) Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 12 / 23 2. Calcul de la transformée de Fourier spatiale (en cartésien ou en sphérique) du champ acoustique mesuré. 3. Interpolation du champ dans le domaine de Fourier : multiplication par un terme propagateur pour obtenir la transformée de Fourier spatiale du champ acoustique sur un autre plan z≥zs (dans le cas de la Figure 5) ou une autre sphère de rayon r≥a (Figure 6 gauche) ou r≤a (Figure 6 droite). 4. Transformée de Fourier inverse pour repasser dans le domaine spatial. Si la surface sur laquelle on calcule le champ acoustique est plus éloignée des sources que la surface de mesure, l’holographie acoustique résout un problème de propagation directe. Dans le cas contraire, on a affaire à un problème de rétro-propagation. A) En coordonnées cartésiennes i) Transformée de Fourier La transformée de Fourier temporelle et sa transformée inverse sont définies dans toute la suite de ce rapport par : De la même manière, les transformées de Fourier spatiales directes et inverses sont définies comme suit : ii) Equation d’onde Considérons p(x,y,z,t) une petite variation de pression acoustique autour de l’équilibre (la pression atmosphérique par exemple). Cette variation de pression satisfait l’équation d’onde en champ libre: (3.1) Où c est la célérité du son dans le milieu (à 20°C, c=343 m/s dans l’air, et c=1481 m/s dans l’eau) et est l’opérateur laplacien qui, en coordonnées cartésiennes, est : Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 13 / 23 En étudiant la transformée de Fourier de l’équation d’onde, on obtient l’équation de Helmholtz : (3.2) Avec le nombre d’onde. Pour simplifier la notation, la transformée de Fourier de p a aussi été notée p. La solution générale de l’équation (3.2) en trois dimensions peut être mise sous la forme d’une somme continue d’ondes planes : (3.3) Les trois composantes ki du vecteur d’onde ne sont pas indépendantes et satisfont : (3.4) On peut donc par exemple choisir kx et ky indépendants (exemple gardé dans la suite) et : Et l’expression de p devient : (3.5) iii) Spectre angulaire : Acoustique de Fourier On suppose par la suite que toutes les sources sont localisées dans le demi-espace z < 0. Si l’on observe l’évolution des composantes du champ de pression avec z dans l’équation (3.5), on peut distinguer : Les composantes évanescentes, qui correspondent à kz imaginaire, et pour lesquelles l’amplitude varie exponentiellement avec z Les composantes propagatives, associées à kz réel, dont l’amplitude ne varie pas avec z. Le terme est ajouté de façon à ce que si l’on se place dans le plan z=0, on reconnaît une transformée de Fourier inverse. P(kx,ky) est appelé le spectre angulaire et est donné par : (3.6) Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 14 / 23 iv) Extrapolation du champ de pression suivant z La connaissance du spectre angulaire est possible à partir du moment où l’on connaît la pression acoustique dans le plan z=0. Nous allons à présent voir qu’à partir de ce spectre P(kx, ky), on peut calculer la pression en n’importe quel point du demi-espace z > 0. Il est démontré dans [10] que la transformée de Fourier suivant x et y de la pression dans un plan z quelconque (que l’on écrit P(kx,ky,z)) est donnée par la relation : De là l’expression générale de l’extrapolation du spectre angulaire calculé sur un plan z=zh vers un plan z=z : (3.7) La partie exponentielle du terme de droite est appelée propagateur. Finalement, si l’on connaît le champ de pression sur un plan z=zh, on peut calculer le champ de pression en tout plan z=z en réalisant la transformée de Fourier inverse de l’équation (3.7). (3.8) En conclusion, si toutes les sources acoustiques sont confinées dans le semi-espace z<zs et si la pression est connue sur un plan z=zh≥zs, alors le spectre angulaire de la pression sur un autre plan z≥zs est donné par l’équation (3.8). L’extrapolation du champ de pression sur n’importe quel autre point du semi-espace z≥zs en utilisant la décomposition en ondes planes (équation (3.5)) s’appelle l’holographie acoustique en coordonnées cartésiennes. Le fait de prendre en compte le champ évanescent définit l’holographie acoustique en champ proche (NAH), et permet d’accéder à une meilleure résolution qu’avec la méthode d’holographie classique (résolution maximale : λ/2 où λ est la longueur d’onde). v) Problème réel de NAH Dans la pratique, un certain nombre de problème se posent lors de la mise en œuvre de la méthode NAH. Ceux-ci sont de trois ordres : Influence du bruit de mesure Influence de la fenêtre spatiale de mesure (taille de l’antenne) Influence de la discrétisation spatiale (espacement entre les microphones) Effets de distance au casque III.A.v.1 Rapport bibliographique 06 Mai 2013 Page 15 / 23 Influence du bruit de mesure Reprenons l’équation (3.8) et considérons que nous sommes dans le cadre du problème de rétro-propagation (z<zh). On remarque alors que pour les ondes évanescentes (pour kx2+ky2 > k2), le propagateur a une croissance exponentielle. Or, dans un problème expérimental, la pression dans le plan z=zh est mesurée expérimentalement. Il y a donc un risque que du bruit ε perturbe la mesure et qu’il soit fortement amplifié par la multiplication avec le propagateur dans le domaine de Fourier. Dans la théorie, on suppose que ce bruit est non corrélé (bruit blanc). La partie 3.4 de [10] décrit les effets de l’ajout du bruit sur la rétro-propagation. Une solution à ce problème de bruit est de filtrer la pression mesurée dans l’espace des nombres d’onde pour limiter l’influence des hautes valeurs de kx et ky. Le filtrage basique consiste à annuler le spectre angulaire de la pression mesurée dès que kx2+ky2 est supérieur à une valeur critique kc2. Ceci revient à le multiplier par une fonction porte et donc à le convoluer dans l’espace (x,y) par un sinus cardinal. Pour limiter les oscillations parasites dues à cette convolution, il convient de modifier la forme du filtre. En traitement holographique, la fenêtre couramment utilisée est de la forme: (3.9) Il s’agit en fait d’une fonction porte dont les discontinuités ont été « adoucies ». Cet adoucissement est contrôlé par le paramètre . Plus ce paramètre est grand, plus la fonction porte est arrondie. La détermination de la valeur critique kc optimale est décrite dans [10]. III.A.v.2 Influence du fenêtrage spatial En plus du bruit, il existe d’autres sources d’erreur dans l’estimation de la solution du problème inverse. Tout d’abord, la théorie prévoit que la pression mesurée doit l’être sur un plan entier (donc infini), ce qui n’est pas du tout réalisable expérimentalement. En réalité, la pression est mesurée sur une certaine fenêtre (Lx,Ly) du plan z=zh. En pratique, on choisit la taille de la fenêtre au moins deux fois supérieure à celle des sources. Le choix de la fenêtre est encore une fois primordial pour limiter l’influence de la fenêtre spatiale sur les résultats du problème inverse. La fenêtre proposée par Williams dans [10] est la fenêtre de Tukey à 8 points. Effets de distance au casque III.A.v.3 Rapport bibliographique 06 Mai 2013 Page 16 / 23 Influence de la discrétisation spatiale Ensuite, une mesure continue sur la fenêtre est impossible. La pression mesurée est donc discrétisée en espace et en temps, ce qui limite notre résolution fréquentielle et spatiale. L’échantillonnage en espace induit un recouvrement dans le calcul de la transformée de Fourier. Le théorème d’échantillonnage stipule que la distance (ou le temps) entre deux échantillons doit être inférieure à la moitié de la plus petite longueur d’onde (ou période) que l’on souhaite étudier. Pour finir, le fait d’avoir des données discrètes implique l’utilisation de la transformée de Fourier discrète. Ayant vu les principes de la NAH en coordonnées cartésiennes et les problématiques engendrées, on peut maintenant passer en coordonnées sphériques. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 17 / 23 B) En coordonnées sphériques i) Equation d’onde Un repère en coordonnées sphériques est défini sur la figure suivante. Figure 7: Repère en coordonnées sphériques La pression acoustique satisfait toujours l’équation d’onde (3.1) sauf qu’à présent le laplacien s’écrit : Dans le cas d’un problème extérieur, c'est-à-dire que la sphère d’étude contient toutes les sources, la solution de l’équation d’onde sortante en coordonnées sphériques peut être décomposée en somme infinie de modes spatiaux (produits de fonctions à variables séparées en r, θ, φ) : (3.10) Où Ynm est l’harmonique sphérique de degré n et d’ordre m (solution de l’équation de Laplace en coordonnées sphériques) qui s’exprime à l’aide des fonctions de Legendre associées : Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 18 / 23 Pmn(r) est appelé le spectre d’onde sphérique de la pression p. Si la pression est connue sur une sphère de rayon r0, [10] montre que le spectre d’onde sphérique de la pression sur une sphère de rayon r peut s’écrire : (3.11) Où hn est la fonction de Hankel sphérique de première espèce de degré n. L’équation (3.11) permet d’extrapoler la pression sur toute sphère contenant les sources acoustiques. ii) Holographie acoustique sphérique Le principe restant le même que celui de la NAH en coordonnées cartésiennes, l’holographie acoustique sphérique est similaire à l’holographie en coordonnées cartésiennes, sauf que la transformée de Fourier spatiale est « remplacée » par la décomposition en harmoniques sphériques. Les problématiques rencontrées dans la partie (II-A) sont donc les mêmes, c'est-à-dire la prise en compte du bruit de mesure, de la discrétisation de la sphère de mesure et du fait que la décomposition décrite comme une somme infinie dans l’équation (3.10) ne pourra pas être infinie. L’holographie sphérique se distingue tout de même de l’holographie plane par le fait qu’elle n’est pas sujette au biais introduit par le fenêtrage spatiale car la sphère est une surface fermée. Toutefois, comme on ne sait pas discrétiser régulièrement une sphère, la détermination du spectre d’onde sphérique sera souvent posé comme un problème mal conditionné. C’est pourquoi il est à présent utile de s’intéresser au problème de régularisation de solution de problème mal-posé. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 19 / 23 IV- Méthode de régularisation (4) Les problèmes numériques rencontrés lors de l’interpolation d’HRTF qui nécessitent une régularisation de la solution peuvent être mis sous la forme : où b est le vecteur qui contient la pression mesurée sur les M points de la sphère (donnée bruitée), x le vecteur qui contient les pondérations des N harmoniques sphériques (inconnues) et A la matrice de taille M*N qui contient l’expression des N harmoniques sphériques pour les N points de mesure (donnée non-bruitée). En général on a M>N. Le but est de réussir à bien estimer x connaissant b dans le cas où la mesure est corrompue par un bruit e : La solution au sens des moindres carrés de ce système est donnée par , où A+ est la pseudo-inverse (de Moore-Penrose) de A. Toutefois, dans le cas de la rétro-propagation, la matrice A sera mal conditionnée et l’amplitude de la solution au sens des moindres carrés sera très dépendante de l’amplitude du bruit de mesure. Afin de mettre en évidence ces effets et de trouver des moyens pour les contrer, nous allons avoir besoin de la décomposition en valeurs singulières. A) Décomposition en valeurs singulières (SVD) Etant donnée une matrice factorisation de A sous la forme : , une décomposition en valeurs singulières de A est une (4.1) Telle que U est une matrice carrée orthogonale de taille M*M dont les colonnes sont les vecteurs singuliers à gauche de A, V est une matrice orthogonale de taille N*N dont les colonnes sont les vecteurs singuliers à droite de A et ∑ est une matrice de taille M*N de la forme : telle que les σi sont les valeurs singulières de A et sont rangées dans l’ordre : Le conditionnement de A est représenté par le nombre σ1/σN. Ce nombre restera convenable dans le cas de la propagation, mais en rétro-propagation, il pourra devenir trop grand. Effets de distance au casque La pseudo-inverse de A est déduite de l’équation (4.1) : Rapport bibliographique 06 Mai 2013 Page 20 / 23 avec : La forme de la pseudo-inverse de ∑ permet de montrer que le bruit de mesure est surtout amplifié par les petites valeurs singulières de A si on résout le système au sens des moindres carrés. L’idée de base pour régulariser la solution est d’éliminer (d’annuler) un certain nombre de petites valeurs singulières [11]. Cette méthode peut être comparée au filtrage des grands nombres d’onde de la partie (III-A-v-1). Cependant, comme dans cette partie, l’annulation brutale de plusieurs valeurs singulières va avoir des effets indésirables. On cherche donc à réguler l’amplification du bruit de manière plus « douce », par exemple en appliquant une régularisation de Tikhonov. B) Régularisation de Tikhonov La résolution du problème au sens des moindres carrés revient à minimiser une fonction coût correspondant à la norme euclidienne du résidu : Le principe de la régularisation de Tikhonov est, plutôt que de minimiser simplement la somme des carrés de l’erreur, de minimiser une fonction coût qui pénalise aussi l’amplitude de la solution : (4.2) où λ est un paramètre de régularisation. La solution qui minimise cette nouvelle fonction coût est : Avec : Le paramètre de régularisation λ réduit l’influence des correspondants aux petites valeurs singulières. Le choix observations faites dans [12] : d’un côté s’il est trop grand, solution sera trop grande, de l’autre s’il est trop petit, la contributions des erreurs de données. coefficients de cette matrice de λ prend en compte deux l’erreur de reconstruction de la solution sera dominée par les Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 21 / 23 La détermination du paramètre de régularisation peut se faire suivant plusieurs méthodes. Les méthodes de validation croisée ordinaire et généralisée sont présentées dans [13]. La validation croisée ordinaire consiste à rechercher la solution des sous-problèmes correspondants au cas où une donnée a été « oubliée » puis à recalculer cette donnée en utilisant le résultat. La solution du problème initial est celle qui minimise les erreurs entre les données mesurées et reconstruites. Seulement cette méthode peut avoir de mauvais résultat, en particulier si les solutions des sous-problèmes mentionnés sont indépendantes de λ. La validation croisée généralisée permet de s’affranchir de ces problèmes en posant que tout bon choix de λ doit être invariant par rotation du système de coordonnées de mesure. Une autre méthode présentée dans [12] et [14] utilise une L-curve (courbe en L), c'est-àdire une courbe en échelle log-log représentant la norme d’une solution régularisée par rapport à la norme du résiduel correspondant. Figure 8: Forme générale d'une courbe en L La figure ci-dessus présente la forme générale d’une courbe en L. Le paramètre de régularisation optimal λlim se trouve à l’angle du L, c'est-à-dire au point de courbure maximale de la courbe en L. En effet, pour λ<λlim, l’amplitude de la solution augmente fortement sans réduction notable du résiduel alors que pour λ>λlim, la norme du résiduel augmente fortement sans pour autant que l’amplitude de la solution augmente. Une méthode du même genre, utilisant une courbe en U est présentée dans [15]. Pour finir, d’autres méthodes sont, en plus de celles présentées précédemment, implémentées dans le package Matlab « Regularization Tools » de Per Christian Hansen et décrites dans le manuel de ce package [16]. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 22 / 23 Bibliographie [1] K.-V. Nguyen, T. Carpentier, M. Noisternig et O. Warusfel, «Calculation of Head Related Transfer Functions in the proximity region using spherical harmonics decomposition: Comparison with measurements and evaluation,» chez Proc. of the 2nd International Symposium on Ambisonics and Spherical Acoustics, 2010. [2] V. Larcher, «Techniques de spatialisation des sons pour la réalité virtuelle,» Thèse de doctorat de l'université de Paris VI, 2001. [3] M. J. Evans, J. A. S. Angus et A. I. Tew, «Analysing head-related transfer function measurements using surface spherical harmonics,» J. Acoust. Soc. Am., pp. 24002411, 1998. [4] D. N. Zotkin, R. Duraiswami et L. S. Davis, «Creation of virtual auditory spaces,» chez International Conference on Acoustics, Speech and Signal Processing, 2002. [5] N. Epain, P. Guillon, A. Kan, R. Kosobrodov, D. Sun, C. Jin et A. Van Schaik, «Objective evaluation of a three-dimensional sound field reproduction system,» chez 20th International Congress on Acoustics, Sydney, 2010. [6] S. Savel, Perception de l'espace sonore, Cours Master2 MPI - Spécialité Acoustique, LMA, 2013. [7] W. Zhang, T. D. Abhayapala, R. A. Kennedy and R. Duraiswami, "Insights into Head Related Transfer Function: Spatial Dimensionality and Continuous Representation," J. Acoust. Soc. Am., pp. 2347-2357, 2010. [8] R. Duraiswami, D. N. Zotkin et N. A. Gumerov, «Interpolation and range extrapolation of HRTFs,» 2004. [9] R. O. Duda et W. L. Martens, «Range dependence of the response of a spherical head model,» J. Acoust. Soc. Am., vol. 104, n° 15, pp. 3048-3058, 1998. [10] E. G. Williams, Fourier Acoustics: Sound Radiation and Nearfield Acoustical Holography, Naval Research Laboratory, Washington, D.C.: Academic Press, 1999. [11] P. A. Nelson et S. H. Yoon, «Estimation of acoustic source strength by inverse methods: Part I, Conditioning of the inverse problem,» Journal of Sound and Vibration, pp. 643-668, 2000. [12] P. C. Hansen, «The L-curve and its use in the numerical treatment of inverse problems,» Computanional Inverse Problems in Electrocardiology, pp. 119-142, 2001. [13] S. H. Yoon et P. A. Nelson, «Estimation of acoustic source strength by inverse methods: Part II, Experimental investigation of methods for choosing regularization parameters,» Journal of Sound and Vibration, pp. 669-705, 2000. Effets de distance au casque Rapport bibliographique 06 Mai 2013 Page 23 / 23 [14] D. Calvetti, S. Morigi, L. Reichel et F. Sgallari, «Tickonov regularization and the L-curve for large discrete ill-posed problems,» Journal of Computanional and Applied Mathematics, pp. 423-446, 2000. [15] D. Krawczyk-Stando et M. Rudnicki, «Regularization parameter selection in discrete illposed problems - the use of the U-curve,» Int. J. Appl. Math. Comput. Sci., vol. 17, n° 12, pp. 157-164, 2007. [16] P. C. Hansen, Regularization Tools: A Matlab package for analysis and solution of discrete ill-posed problems, Lyngby, 2008.