Qualité sonore des trains TGV : influence des facteurs perceptifs

Transcription

Qualité sonore des trains TGV : influence des facteurs perceptifs
10ème Congrès Français d'Acoustique
Lyon, 12-16 Avril 2010
Qualité sonore des trains TGV : influence des facteurs perceptifs – analyse
multidimensionnelle et préférentielle.
Jonathan Terroir1, Catherine Lavandier1
1
LMRTE, Université de Cergy Pontoise, 5 Mail Gay Lussac, Neuville, 95031 Cergy Pontoise Cedex, France,
{jonathan.terroir,catherine.lavandier}@u-cergy.fr
Ce travail traite de la qualité sonore de passages de trains TGV. Plus précisément, l'objectif consiste à
caractériser perceptivement ceux-ci et, en particulier, à vérifier si les informations temporelles sont bien perçues
et dans quelle mesure. Afin d'extraire les caractéristiques temporelles perceptives des passages et d'éviter que les
variations de force sonore ne masquent les autres propriétés des stimuli, tous les signaux ont été préalablement
égalisés en niveau. Lors de la mise en place des tests, une variation de niveau (+0dB / +2dB) a tout de même été
introduite en tant que paramètre variable afin de comparer l'influence de ce facteur (généralement dominant) à
celle des autres paramètres. Le second facteur variable est la distance par rapport aux voies ferrées (7.5m, 50m et
100m), ce qui va impliquer des différences temporelles et fréquentielles entre les stimuli. Le test perceptif
proposé aux sujets est basé sur le principe de comparaison par paires: pour chaque paire du corpus, les sujets
doivent estimer la dissimilarité entre les deux signaux, indiquer leur préférence et expliquer verbalement leur
choix. Une analyse multidimensionnelle (INDSCAL) va alors permettre d'extraire les attributs perceptifs
significatifs, la tache de verbalisation facilitant ou permettant d'interpréter les axes de cette analyse. En parallèle,
l'analyse des préférences va permettre de focaliser sur les facteurs importants liés à la qualité sonore des
passages.
1
Introduction
Les nuisances sonores, et plus spécifiquement celles
liées aux transports, apparaissent comme une préoccupation
majeure des ménages français [1] et européens [2].
Considéré comme moins nuisible que les trafics routiers et
aériens mais, dans le contexte d’un essor des politiques du
développement durable, moyen de transport majeur du
futur, le train fait par conséquent l'objet d'études diverses.
On citera, par exemple, des travaux liés à la perturbation du
sommeil [3] [4] ou la gêne [5] [6]. Afin de prévenir les
désagréments et gênes provoqués par un plus grand nombre
de passages et/ou la construction de nouvelles lignes, des
études ont été planifiées dont le projet franco-allemand
PREDIT/DEUFRAKO intitulé “Bruit des transports,
influence de la structure temporelle sur la gêne, la
performance cognitive et le sommeil”. Son objectif
principal est d’améliorer l’état des connaissances
concernant l’influence du bruit des transports sur le
sommeil et l’activité journalière afin de les appliquer
ultérieurement au développement de mesures de réduction
du bruit. Dans le cadre de ce projet, un des objectifs du
LMRTE consiste à caractériser, pour les trains, les
phénomènes perceptibles et évaluer leur influence sur la
qualité sonore. Cette étude est basée sur l’évaluation de
signaux enregistrés sur site et nous étudierons l’influence
du niveau et de la distance par rapport aux voies, ainsi que
les interactions possibles. Notons que la modification de la
distance est corrélée à des variations de spectre et
d’enveloppe temporelle. Si l’étude a été menée pour quatre
catégories de trains (Corail, Fret, TER, TGV), nous ne
présentons dans cet article que les résultats dédiés aux trains
TGV pour des raisons de clarté. En effet, si chaque
catégorie présente des spécificités, les conclusions
demeurent similaires.
2
Méthodologie
2.1 Stimuli
Enregistrements : Les stimuli sont issus de deux séries
d’enregistrements de TGV à 7.5m, 50m et 100m des voies.
Nous avons retenu un enregistrement par distance. La
longueur et la vitesse des trains sont identiques (2 machines
+ 10 wagons ; 160km/h). Tous les stimuli durent 38
secondes et ne contiennent qu’un unique passage de train
centré temporellement. Sachant que le niveau est en grande
partie responsable du désagrément [7] [8] [9], les signaux
ont été normalisés en force sonore (cf. ci-après) afin de ne
pas masquer d’autres effets potentiellement importants.
Finalement, une variation de niveau faible et maitrisée a été
introduite afin de pouvoir comparer son influence à celles
d’autres effets perceptifs: de nouvelles versions des
enregistrements normalisés ont été créées en augmentant le
niveau moyen de 2dB et celles-ci ont été incluses au corpus.
La différence de niveau est donc perceptible sans pour
autant masquer les effets temporels ou spectraux.
Normalisation : Des études antérieures [10] [11] [12]
ont conduit à des résultats divers quant à la solution
optimale pour l’égalisation des stimuli. Il semble que le
choix d’une normalisation par rapport aux niveaux
émergents puisse être judicieux mais que l’optimisation de
ce choix dépende également de la nature des signaux. Dans
notre cas, la normalisation par rapport au niveau LAeq est
finalement apparue la plus adaptée, étant celle pour laquelle
les différences de niveaux perçues nous ont semblé
moindres (ce qui confirme les résultats de Fastl et Ugolotti
[13] pour les bruits d’avion). De plus, ce choix s’avère être
homogène avec les normes européennes définies en dB(A).
La validation de la normalisation a été effectuée en interne.
Propriétés : Afin de pouvoir ultérieurement corréler les
réponses des sujets avec des grandeurs objectives, les
valeurs de divers indicateurs ont été calculées. Celles-ci
correspondent à la moyenne des valeurs obtenues pour les
canaux gauche et droite [14]. La grandeur Fluctuations
correspond à la force de fluctuation du signal et LASlopeUp à
la pente de l’évolution temporelle du niveau durant
l’approche du train. Elle est calculée entre un seuil
préalablement fixé et le niveau maximum de la section du
signal considérée [15]. Le seuil a été déterminé de façon à
être en accord avec les descriptions des sujets. TLAmax-10 est
le temps de passage où le niveau est 10dB en dessous du
maximum [15]. LN est le niveau de sonie, LAmax le niveau
maximum, LAeq le niveau équivalent, SCGMax et SCGMean les
centres de gravité maximum et moyen.
Signaux
Fluctuations(vacils)
LASlopeUp (dB(A))
TLAmax-10 (s)
LN (phones)
LAmax (dB(A))
SCGMax (Hz)
SCGMean (Hz)
Acuité (acum)
LAeq (dB(A))
7.5m 50m 100m
2.3
10
7.3
78.1
79.7
1274
419
1.5
60
0.1
6.6
7.3
76.5
75.9
1096
325
1.5
59.8
0.2
2.2
8.3
75.5
76
794
163
1.4
58.9
7.5m 50m 100m
+2dB +2dB +2dB
2.3
0.1
0.3
10
6.6
2.2
7.3
7.3
8.3
80
78.8 77.6
81.7 77.9
78
1274 1096 794
419
325
163
1.5
1.5
1.4
62
61.8 60.9
avons choisis la méthode multifactorielle INDSCAL car
elle a l’avantage de fixer les axes qui sous-tendent l’espace
perceptif, ce qui facilite l’interprétation de ces axes qui ne
sont portés a priori par aucun attribut. En, revanche, les
coordonnées des objets sur les axes sont normalisées. Les
distances entre les objets ne sont donc pas conservées
visuellement sur les plans factoriels. Une autre particularité
est que les axes ne sont pas nécessairement orthogonaux.
Les distances d i jk entre les stimuli j et k évaluées par le sujet
i sont calculées en précisant le poids wit que chacun des
sujets accorde à la dimension t et xkt la composante du
stimulus k sur la dimension t:
d i jk
[
r
wit [ x jt
xkt ]2 ]1/ 2
(1)
t 1
L’analyse fournit alors une représentation dans l’espace
des facteurs pilotant la perception, les poids des sujets et la
variance expliquée par chacun de ces facteurs.
Table 1 : Indicateurs calculés pour le corpus de stimuli.
2.2 Sujets
Vingt sujets ont participé aux tests (moyenne d’âge = 20
ans; écart : de 18 à 23 ans). Ils étaient rémunérés pour leurs
services, n’ont effectué le test qu’une seule fois et n’étaient
impliqués dans aucune autre étude acoustique.
2.3 Procédure expérimentale
Restitution : La restitution des signaux a été faite via un
casque d’écoute de haute fidélité AKG K 501 © à un niveau
LAeq de 59.5±0.6dB(A) ou 61.5±0.6dB(A). Même si une
restitution au casque peut conduire à un effet
d’intériorisation du son, nous l’avons préférée à une
restitution sur enceintes afin d’éviter des effets de salle.
Méthode : Ce test est basé sur la méthode classique de
comparaisons par paires utilisée dans de nombreuses études
perceptives [16] [17] [18]. Le corpus compte 15 paires de
sons (on exclut la comparaison d’un stimulus avec luimême). L’ordre de présentation est aléatoire et l’écoute des
signaux est renouvelable à volonté. Les sujets sont
autonomes, le programme présentant les stimuli et
enregistrant les réponses de manière automatisée. Pour
chaque paire, le candidat doit estimer la dissimilarité
existant entre les deux stimuli sur une échelle allant de 0
(totalement similaires) à 10 (totalement différents), indiquer
sa préférence et justifier verbalement ses choix.
Dissimilarités : Afin d’extraire les paramètres
perceptifs de l’ensemble de stimuli, nous avons effectué une
analyse multidimensionnelle INDSCAL [19]. Celle-ci a
pour objectif la construction d’un espace perceptif euclidien
dans lequel est représenté l’ensemble des stimuli. La
distance entre les points constitue alors une similarité. Nous
Figure 1 : Sonagrammes des stimuli enregistrés à 7.50m
(haut), 50m (centre) et 100m (bas) après normalisation par
rapport au niveau LAeq.
Verbalisations : L’analyse linguistique permet
d’extraire les caractéristiques perçues et influentes. Après
avoir évalué préférence et dissimilarité, les sujets justifient
leurs choix. Dans cette analyse, nous nous sommes
focalisés sur les adjectifs “qualificatifs”.
Préférences : La méthode de Thurstone-Mosteller [20]
[21] permet de classer les sons à partir des choix effectués
par l’ensemble des sujets. Cette méthode suppose qu’il
existe une échelle subjective continue représentant la
sensation mesurée et implique donc une relation de
transitivité entre les stimuli.
Consistance : Pour chaque sujet, il est possible
d’évaluer la « consistance » des réponses [22]. Par là on
entend qu’il existe une relation de transitivité entre cellesci. Une erreur circulaire apparait lorsque cette relation n’est
pas respectée. Le nombre d’erreurs circulaires c effectuées
par chaque sujet peut être calculé [23] :
N s ( N s 1)(2 N s 1)
12
c
Ns
Sk2
(2)
k 1
Avec Ns le nombre de stimuli et Sk le nombre de votes
attribués par le sujet pour le son k. Le coefficient de
consistance ξ du sujet vaut alors : ξ=1-c/D, avec D=( N s3 Ns)/24 si Ns est impair, D=( N s3 -4Ns)/24 si Ns est pair. Ainsi,
plus le nombre d’erreurs circulaires est faible, plus le sujet
est consistant dans ses réponses.
Concordance : Le coefficient de concordance de
Kendall W [22] permet d’évaluer le degré d’accord entre les
sujets:
12
W
n
R
2
j
j 1
n 2 N S ( N S2 1)
3( N S 1)
NS 1
(3)
Avec n le nombre de sujets et Rj la somme des rangs
attribués au stimulus j [24]. Plus W est grand, plus les sujets
sont concordants. Pour faciliter l’interprétation de W, on
calcule le coefficient de Spearman rs sur la base de W sur
les classements de tous les couples possibles de juges [24]:
rs=(nW-1)/(n-1). Le nombre de stimuli Ns est alors pris en
considération lors de l’interprétation de rs via la table de
Spearman [25] qui relie valeurs critiques de rs et
probabilités associées en fonction de Ns.
3
Résultats
3.1 Analyse des dissimilarités
L’analyse des plans perceptifs et des propriétés des
stimuli va permettre de déterminer quels aspects ont joué un
rôle significatif dans les choix des sujets. Dans cette étude,
une analyse INDSCAL (cf. paragraphe 2.3) à 3 dimensions
est apparue comme étant la plus judicieuse, la considération
de dimension(s) additionnelle(s) n’ayant pas permis de
mettre en évidence un effet perceptif supplémentaire.
La figure 2 présente la répartition des stimuli dans
différents plans INDSCAL. La dissociation entre les
passages à 7.5m et les passages à 50m et 100m est faite
selon l’axe X (qui explique 58% de la variance). Si l’on se
réfère aux propriétés des stimuli (cf. tableau 1), les passages
enregistrés à 7.5m sont différenciables des passages à 50m
et 100m par de nombreux aspects : rythme, soudaineté de
l’arrivée, niveau maximum ou spectre. Les corrélations
entre les axes des plans et les indicateurs ont été calculées
(tableau 2) et l’axe X apparait en premier lieu lié aux
Fluctuations (R=-0.98 ; p=0.0007) : le rythme apparait
comme le premier aspect discriminant.
Figure 2: Espaces des dissimilarités. Les pourcentages
de variance expliquée pour chaque axe sont indiqués entre
parenthèses.
La distinction entre les signaux à 50m et 100m est faite
selon l’axe Y (14% de la variance expliquée). La
distribution le long de cet axe est corrélée à des aspects
spectraux tels que le centre de gravité maximum (R=-0.90 ;
p=0.0156), le centre de gravité moyen (R=-0.90 ; p=0.0152)
ou l’acuité (R=-0.97 ; p=0.0017), ainsi qu’à des indicateurs
temporels liés à la soudaineté LASlopeUp (R=-0.87 ;
p= 0.0254) ou la durée du passage TLAmax-10 (R=0.97 ;
p=0.0017). Or, ces caractéristiques sont elles-mêmes
corrélées : avec la distance de mesure, le spectre et
l’enveloppe sont indissociablement modifiés. L’axe Y est
donc simultanément lié aux aspects temporels et spectraux.
X
Y
Z
Fluctuations -0.98** -0.43 0.57
LASlopeUp
-0.72 -0.87* 0.33
TLAmax-10
0.36
0.97** -0.10
LN
-0.49
-0.64 0.77
LAeq
-0.12
-0.52 0.69
LAMax
-0.80
-0.45 0.81
SCGMax
-0.67 -0.90* 0.30
SCGMean
-0.67 -0.90* 0.30
Acuité
-0.36 -0.97** 0.10
Table 2 : Corrélations de Pearson existant entre les axes
des plans INDSCAL et différents indicateurs. La valeur est
suivie de ** si la probabilité testant la signification
statistique de la corrélation est inférieure à 0.01 et de * si
celle-ci est inférieure à 0.05.
Le niveau apparait réparti selon l’axe Z, lui-même
corrélé au niveau de sonie et au niveau maximum.
L’absence de significativité statistique peut s’expliquer par
le fait que, pour les signaux enregistrés à 7.5m des voies, le
niveau n’a pas d’influence sur la position des stimuli dans
l’espace perceptif : il semble que les fluctuations de niveau
masquent l’effet du niveau global.
temporel, un grand nombre d’adjectifs sont liés à l’aspect
rythmique (“régulier”, “fluide”), mais la soudaineté de
l’arrivée est également perçue (“brusque”, “soudain”). Les
sujets préfèrent alors un son long et fluide à un son plus
court mais plus rythmique (“[Ce son est] plus long mais
plus calme”). Concernant les aspects spectraux, les
verbalisations sont assez peu diversifiées et nous informent
surtout quant à la perception “grave”/“aigu” des passages,
les basses fréquences étant préférées de manière générale.
Enfin, un troisième groupe est lié à l’intensité perçue et
confirme le fait que, plus le niveau perçu est important,
moins le son est apprécié.
3.2 Analyse linguistique
Le tableau 3 regroupe les adjectifs utilisés par les sujets
pour qualifier les passages. Les réponses sont, en premier
lieu, massivement liées à la temporalité, suivie par le critère
d’intensité, les adjectifs relatifs au timbre arrivant en
troisième position. On peut ajouter une remarque
concernant la « spatialité », les adjectifs “lointain”,
“éloigné” et “loin” ayant respectivement 4, 3 et 5
occurrences : ce paramètre a donc été pris en compte lors de
l’évaluation des sons mais demeure associé à une
combinaison d’indicateurs que sont le niveau, le spectre, la
soudaineté et la durée du passage. Concernant l’aspect
Total
Total global
Temporalité
Positif
Négatif
court (26)
saccadé (13)
continu (8)
long (8)
calme (5)
irrégulier (3)
régulier (7)
brouillon (2)
fluide (3)
brusque (1)
progressif (2)
lent (1)
bref (2)
périodique (1)
constant (2)
répétitif (1)
linéaire (1)
soudain (1)
monotone (1)
variable (1)
rapide (1)
59
32
90 occurrences
Hauteur et timbre
Positif
Négatif
grave (10)
aigu (8)
harmonieux (2)
strident (4)
sourd (2)
métallique (1)
12
15
27 occurrences
Intensité
Positif
Négatif
doux (11)
fort (25)
discret (9)
bruyant (6)
léger (2)
élevé (2)
intense (2)
sonore (1)
strident (4)
22
39
61 occurrences
Table 3 : Récapitulatif des adjectifs qualificatifs liés à la temporalité (italique : adjectifs liés aux fluctuations; souligné :
adjectifs lies à la soudaineté de l’arrivée), le spectre et le niveau.
Concernant les comparaisons entre passages à 7.5m et
passages à 50m et 100m, l’analyse des verbalisations
montre que le premier facteur de préférence est le rythme
du son avec parfois l’apparition d’un aspect spectral
concernant le côté “strident” du passage à 50m, un
sifflement étant présent pour cet enregistrement et pouvant
déranger. Nous rapportons ici deux réponses de sujets
concernant la comparaison du passage à 7.5m et du passage
à 50m : “Les 2 [passages] sont peu gênants et permettent
par exemple de tenir une conversation avec quelqu’un, mais
le premier est irrégulier et plus gênant”; “[Pour le passage
à 50m, le] son [est] plus strident mais l’arrivée [est] moins
brutale” (le passage à 50m est préféré dans les deux cas).
Les verbalisations concernant les signaux à 50m et
100m sont basées d’abord sur le niveau perçu, ensuite sur
certains aspects temporels couplés : durée et soudaineté.
Ainsi, concernant le passage à 100m qu’il préfère à celui à
50m, un sujet répond : “un peu plus long, mais moins
intense”. Enfin, la soudaineté de l’arrivée joue également
un rôle dans la différenciation : le passage à 100m est
préféré car son “arrivée [n’est] pas trop brutale (…):[le son
est] progressif, avec un seul pic de bruit perçu”; de même
le passage à 100m est préféré car “moins agressif (autre
train trop rapide)”. L’influence du rythme ou de la
soudaineté d’arrivée apparaissent donc primordiaux dans la
perception des sujets.
3.3 Préférences
Consistance : La consistance des sujets et le nombre
d’erreurs circulaires ont été calculés comme décrit dans le
paragraphe 2.3 :
ξ
1.000 0.875 0.750 0.625 0.5 0.25
c
0
1
2
3
4
6
Nombre de sujets
7
1
1
4
2
5
Table 4: Coefficients de consistance ξ, nombre d’erreurs
circulaires c et nombre de sujets.
En fonction du nombre d’erreurs circulaires c (et donc de ξ)
et du nombre de stimuli Ns, Kendall propose des valeurs
limites permettant d’évaluer la cohérence des réponses du
sujet. Ainsi, pour Ns=6, il existe une probabilité p associée
au nombre d’erreurs circulaires c [26]. On a alors pour c=0,
p=0.019825; c=1, p=0.047693; pour c=2, p=0.104864, etc.
Or, seulement 8 sujets sur 20 ont effectué 0 ou 1 unique
erreur circulaire (p<0.05). Cette faible consistance des
réponses peut s’expliquer soit par un changement de
stratégie d’évaluation durant le test (focalisation successive
sur différentes caractéristiques du son), soit à cause de
l’aléatoire des réponses (stimuli trop ressemblants,
fatigue…).
Concordance : Le coefficient de concordance de
Kendall permet d’évaluer le degré d’accord entre les sujets.
Les valeurs de Rj, puis celles du coefficient de Spearman rs
ont été calculées (cf. paragraphe 2.3). En se référant à la
table de Spearman [25], pour Ns=6 et si l’on désire une
valeur significative à 95%, la valeur critique de rs est égale
de 0.886 (si rs ≥ 0.886, cela équivaut à affirmer avec moins
de 5% de chances de se tromper que la concordance entre
les sujets n'est pas le fruit du hasard). Dans notre cas,
rs=0.4659 si l’on considère l’ensemble des sujets et
rs=0.6402 si l’on exclut les 5 sujets les plus inconsistants.
D’après la table [25], nous avons, dans le meilleur des cas,
un peu plus de 20% de chances de nous tromper si l’on
affirme qu’il y a concordance des sujets (après exclusion
des 5 sujets les plus inconsistants). Il semble donc que les
sujets n’ont pas opté pour des stratégies d’évaluation
similaires.
de régressions. Afin d’éviter d’ignorer une grandeur qui
pourrait avoir une influence significative, nous avons
évalué la robustesse des régressions pour chacune des deux
grandeurs liées à la longueur et à la soudaineté. Le résultat
remarquable est que c’est lorsque l’on inclut uniquement le
niveau de sonie et les fluctuations que la régression fournit
le meilleur résultat, expliquant 93.80% de la variabilité (R2
ajusté) avec une relation statistiquement significative entre
les variables au niveau de confiance de 95%. L’ajout d’une
ou plusieurs grandeurs supplémentaires ne permet pas
d’améliorer de façon significative le résultat : le niveau et le
rythme sont les éléments majeurs corrélés aux préférences.
Echelle des préférences : La partie gauche de la figure
3 présente l’échelle des préférences (cf. paragraphe 2.3)
pour la totalité des sujets. Comme ce que suggéraient les
plans de dissimilarité, les signaux à 7.5m sont différenciés
et désignés comme étant les plus désagréables. Les
préférences sont d’ailleurs corrélées à 83% avec l’axe X de
la représentation INDSCAL (lui-même corrélé aux
fluctuations). L’effet du niveau apparait également
clairement. En revanche, le choix entre les signaux à 50m et
100m demeure indécis, les résultats étant proches pour les
deux distances et ne respectant pas une hiérarchie donnée.
Afin de vérifier si cette confusion est due au manque de
consistance, on compare le corpus complet aux sujets
consistants uniquement. On note alors un étirement de
l’échelle utilisée et une inversion entre les passages à 50m
et à 100m, l’absence de hiérarchie entre 50m et 100m étant
toujours présente. Les variations de pente et/ou de timbre ne
sont donc pas intervenues de manière consensuelle dans le
choix des sujets vis-à-vis du désagrément sonore.
Si l’on ne considère que les sujets consistants, les
résultats sont similaires et il existe une corrélation de 99%
(p=0.0215) entre la régression obtenue pour le corpus
complet et celle obtenue pour les sujets consistants seuls.
Figure 3: Classement des préférences pour la totalité
des sujets (à gauche) et pour les sujets consistants
uniquement (à droite).
3.4 Régressions
Afin d’établir une relation entre les analyses précédentes et
les indicateurs objectifs, nous avons relié les préférences
des sujets aux quatre principaux aspects semblant avoir
guidés leurs choix : le rythme, le niveau, le timbre et la
soudaineté de l’arrivée ou la longueur du passage. Les
Fluctuations, le niveau de sonie LN, le centre de gravité
moyen SCGMean et la longueur (TLAMax-10) ou la soudaineté
(LASlopeUp) du passage ont alors été inclus dans les calculs
Préférences = 16.18 – 0.21* LN – 0.212*Fluctuations
4
(4)
Discussion - Conclusions
D’après les analyses précédentes, on sait que (1) le
rythme est le premier facteur de discrimination; (2) si la
différence de niveau est en général bien perçue, les
fluctuations rendent cette différence moins évidente; (3) le
niveau demeure plus influant que les autres attributs liés à
l’enveloppe temporelle ou au spectre ; (4) à niveau
équivalent, lorsqu’il y a comparaison entre les signaux à
50m et 100m, aucun consensus n’apparait. Il est donc
difficile de déterminer la/les stratégie(s) employée(s) par les
sujets. Existe-t-il différents groupes de sujets aux stratégies
fixes ? Les sujets changent-ils de stratégies au cours du
test ? Ces changements sont-ils les mêmes pour tous ?
On a vu qu’au-delà d’un certain seuil (50m dans notre
cas), les fluctuations étant moins importantes, la longueur et
le spectre deviennent des paramètres discriminatoires. Or,
même si ces aspects n’apparaissent pas dans les classements
de préférences, cela ne signifie pas forcément que les sujets
n’y ont pas été sensibles et l’on peut supposer que des
changements de stratégies au cours du test ont conduit à un
effet d’annulation sur les résultats moyennés.
Si l’on se focalise sur les paires pour lesquelles les
comportements des sujets sont les plus difficilement
interprétables (50m/100m ; 50m+2dB/100m+2dB) et que
l’on met en parallèle choix et explications, aucun consensus
n’apparait et, pour un même sujet, les stratégies changent
généralement au cours du test. De plus, on ne distingue pas
de groupes distincts aux stratégies similaires : les propriétés
des signaux sont proches et les sujets focalisent
successivement sur différents aspects. De la même manière,
seulement 9 sujets sur 20 conservent la même préférence
pour les 2 niveaux différents mais sans que cela soit lié à la
consistance de leurs réponses et généralement sans
conserver une stratégie similaire pour ces 2 paires.
D’une manière plus globale, la longueur du passage
apparait comme l’aspect le plus cité (8 occurrences pour 40
évaluations), ce qui est confirmé par le fait que 3 des sujets
cohérents citent systématiquement celle-ci comme
paramètre discriminatoire. Généralement, les passages plus
courts sont préférés. Enfin, aucun sujet n’argumente de
manière cohérente par rapport au spectre.
Les aspects temporels semblent donc majeurs dans
l’évaluation de la qualité sonore de sources temporellement
variables. Si le taux de fluctuation et le temps de passage
semblent adaptés pour qualifier les passages de TGV, les
résultats sont moins convaincants pour les autres catégories
de trains (en ce qui concerne les fluctuations du moins). Il
apparait donc indispensable de persévérer dans le
développement d’outils psychoacoustiques permettant de
mieux évaluer les variations temporelles, les outils actuels
pouvant manquer de pertinence. Il est important de noter
que les résultats de cette étude se situent dans un contexte
d’évaluation de qualité sonore. Il faudra vérifier
ultérieurement si ces conclusions peuvent être extrapolées
dans des conditions plus proches du quotidien.
Références
[12]
Meunier S., Marchioni A., “Loudness of sounds with
temporal variable intensity”, Forum Acousticum,
Sevilla (2002).
[13]
Fastl H., Ugolotti E., “Technical note: Subjective
and physical evaluation of aircraft noise”, Noise
Control Engineering Journal 3(35), 61–63 (1990).
[14]
Preis A., Satoh F., Ishibashi M., Tachibana H.,
“Binaural loudness perception of the time varying
environmental stimuli”, Joint meeting Forum
Acusticum & 137th ASA, Berlin (1999).
[15]
Barbot B., “Caractérisation perceptive des bruits
d’avions : Conséquences sur l’expression de la gêne
fonctionnelle”, PhD thesis, Université de CergyPontoise (2008).
[16]
Leite R. P., Paul S., Gerges S.N.Y., “A sound
quality-based investigation of the HVAC system
noise of an automobile model”, Applied Acoustics
70(4), 636-645 (2009).
[1]
Marquis-Favre C., Faure J., “Relationship between
physical and perceptual attributes of sounds
transmitted through a thin glass plate”, Forum
Acousticum, Sevilla (2002).
[2]
Berglung B. et al. “Guidelines for community
noise”, Technical report, Organisation Mondiale de
la Santé (2000).
[3]
Vernet M., “Effect of train noise on sleep for people
living in houses bordering the railway line”, Journal
of Sound and Vibration 66(3), 483-492 (1979).
[17]
Susini P. et al., “Characterizing the sound quality of
air-conditioning noise”, Applied Acoustics 65, 763–
790 (2004).
[4]
Saremi M., Grenèche J., Bonnefond A., Rohmer O.,
Eschenlauer A., Tassi P., “Effects of nocturnal
railway noise on sleep fragmentation in young and
middle-aged subjects as a function of type of train
and sound level”, International Journal of
Psychophysiology 70(3), 184-191 (2008).
[18]
Parizet E. et al., “Comparison of some listening test
methods : a case study”, Acta Acustica 91(2), 356–
364, (2005).
[19]
Lambert J., Champelovier P., Vernet I., “Annoyance
from high-speed train noise : A social survey”,
Journal of Sound and Vibration 193(1), 21-28
(1996).
Caroll J.D., Chang J., “Analysis of individual
differences in multidimensional scaling via n-way
generalyzation of “eckart-young” decomposition”,
Psychometrika 35(3), 283-329 (1970).
[20]
Thurstone L.L., “WA law of comparative
judgment”, Psychological Review 34, 273–286
(1927).
[6]
Åhrlin U., “Activity disturbances caused by different
environmental noises”, Journal of Sound and
Vibration 127(3), 599-603 (1988).
[21]
Charton B., “Etude comparative de la perception
d’ambiances lumineuses en milieu réel et en milieu
virtuel”, PhD thesis, INSA de Lyon (2002).
[7]
Paulsen R., “On the influence of the stimulus
duration on psychophysical judgement of
environmental noises taken in the laboratory”, Inter
Noise 97, Budapest, 1175–1178 (1997).
[22]
Kendall M.G., Babington Smith B., “On the method
of Paired Comparisons”, Biometrika 31(3-4), 324345 (1970).
[8]
Parry H.J., Parry J.K., “The interpretation and
meaning of laboratory determinations of the effect of
duration on the judged acceptability of noise”,
Journal of Sound and Vibration 20(1), 51–57 (1972).
[23]
Gass S. I., “Tournaments, Transitivity and Pairwise
Comparison Matrices”, Journal of the Operational
Research Society 49(6), 616-624 (1998).
[24]
Howell D.C., “Méthodes statistiques en sciences
humaines”. De Boeck (1998).
[25]
Guéguen N., “Statistiques pour psychologies”,
Dunod, 379 (2005).
[26]
Knezek G., Wallace S., Dunn-Rankin P., “Accuracy
of Kendall's chi-square approximation to circular
triad distributions”. Psychometrika 63(1), 23-34
(1998).
[5]
[9]
[10]
[11]
Little J.W., Mabry J., “Sound duration and its effect
on judged annoyance”, Journal of Sound and
Vibration 9(2), 247–262 (1969).
Fastl H., “The psychoacoustics of sound-quality
evaluation”, ACUSTICA, Acta Acustica 3(83), 754764 (1997).
Raimbault M., “Simulation des ambiances sonores
urbaines: intégration des aspects qualitatifs”. PhD
thesis, Université de Nantes (2002).