Sonie SMPTE Montreal 2010
Transcription
Sonie SMPTE Montreal 2010
Développement de la mesure de sonie UIT-R BS.1770 Michel Lavoie Scott Norcross Systèmes audio de pointe Centre de recherches sur les communications Canada SMPTE (Montréal) – le 19 janvier 2010 Sommaire • Introduction • Tests d’écoute • Évaluation des systèmes de calcul de la sonie • Élaboration d’une technique de mesure multicanal • True-Peak 2 Introduction: la sonie • La sonie est le niveau perçu d’un son. Cette propriété est subjective et varie d’une personne à l’autre. • Malgré ces différences, existe-t-il un mécanisme psychoacoustique, commun à tous, qui nous permettrait de prédire la réponse moyenne des auditeurs? • Pour répondre au besoin de maintenir des niveaux de sonie équilibrés, l’industrie de la radio et de la télédiffusion s’est rassemblée pour trouver une solution. 3 Introduction • Le Groupe rapporteur SRG3 de l’Union internationale des télécommunications (UIT) a été formé pour étudier les besoins des radiodiffuseurs touchant la sonie (techniques de mesures, instrumentation, niveaux de référence). • Le premier projet cherchait à identifer un instrument de calcul de sonie long-terme. • La sonie long-terme (ou intégrée) est une mesure de la sonie moyenne d’un son. L’intervalle de mesure est indéfini afin de permettre la comparaison de mesures de différentes durées. • Le projet d’évaluation était divisé en deux volets: – tests subjectifs, et – comparaison des données subjectives aux mesures objectives fournies par les instruments proposés. 4 Tests subjectifs de l’UIT • Une méthodologie a été développée par laquelle les sujets devaient équilibrer la sonie d’un groupe de séquences audio. • Le sujet devait ajuster le niveau d’écoute de chaque séquence audio de sorte que le niveau perçu était pareil à celui d’une séquence de référence. Référence Séquence test 5 Tableau de contrôle 6 Tests d’écoute: conditions générales • 96 séquences monophoniques fournies par les radiodiffuseurs, représentant des catégories telles que les sports, les émissions dramatiques, la musique et les effets sonores. • Les séquences de voix représentaient plusieurs langues. • La référence consistait en un extrait de parole féminine. Le niveau d’écoute de cette référence était fixé à 60 dBA SPL. • Une enceinte acoustique sans traitement électronique • Conditions d’écoute contrôlées: acoustique conforme (ou presque) à la norme BS.1116 7 Tests d’écoute • Cinq organismes (CRC, ONF, BBC, ABC, NAL) ont participé aux tests d’écoute pour générer une base de données subjectives. • 97 participants. Corrélation des données parmi les 5 sites r = 0.99 8 Mesure objective de la sonie • Le groupe SRG3 a sollicité des propositions pour un instrument de mesure de sonie long-terme. • 7 compagnies (Dag2000/IRT, Dolby Laboratories, Dorrough, NHK/Yamaki, Opticom, Pinguin et TC Electronic) ont répondu à l’appel en proposant 10 systèmes. • Le CRC a proposé 2 systèmes simples pour établir un point de comparaison. • Les mesures objectives de sonie ont été prises sur les séquences audio conformément aux directives du fabricant. 9 Évaluation des systèmes proposés • 9 indices d’évaluation ont été utilisés pour comparer les systèmes aux données subjectives (corrélation, erreur moyenne, erreur maximale, etc…). • Pendant l’étape d’évaluation, l’identité des 12 systèmes est restée cachée. • Une comparaison directe des données subjectives aux données objectives résume bien le rendement de chaque système. 10 Gain objectif (dB) Résultats: Leq A r = 0.929 Gain subjectif (dB) 11 Gain objectif (dB) Exemple d’un système de mesure faible r = 0.848 Gain subjectif (dB) 12 Gain objectif (dB) Résultats: Leq RLB r = 0.982 Gain subjectif (dB) 13 Tests de l’UIT • La meilleure performance a été obtenue avec un système proposé par le CRC qui consistait d’un simple calcul Leq précédé d’un filtre passe-haut. • La pondération en fréquence du filtre est décrite par la courbe RLB (Revised Low-frequency B-curve). • Le résultat des tests de l’UIT a été confirmé à la suite d’une deuxième série de tests subjectifs en utilisant des séquences fournies par les fabricants de systèmes. x Filtre passe-haut RLB xRLB 2 T xRLB 1 2 xréf T Σ Leq (RLB) Puissance moyenne 14 Niveau relatif (dB) Courbe de réponse du filtre RLB Fréquence (Hz) 15 Élaboration de l’algorithme multicanal • Le CRC a mené une étude pour modifier Leq (RLB) afin de permettre la mesure de séquences multicanaux. • Il fut nécessaire d’ajouter à la base de données subjective • 144 séquences audio ont été utilisées pour la nouvelle série de tests d’écoute, soient: – – – – • 48 séquences 5 canaux; 48 séquences stéréo; 24 séquences monophoniques (une voie); et 24 séquences monophoniques (deux voies). Conditions d’écoute semblable à celles des tests de l’UIT 16 Calcul de la sonie multicanal xL Pré-filtre Filtre RLB xR Pré-filtre Filtre RLB xC Pré-filtre Filtre RLB xLs Pré-filtre Filtre RLB xRs Pré-filtre Filtre RLB yL yR yC yLs yRs Puissance moyenne Puissance moyenne Puissance moyenne Puissance moyenne Puissance moyenne zL zR zC zLs zRs GL GR GC Σ Sonie GLs GRs • Chaque entrée est filtrée et un gain Gx s’applique à la puissance moyenne de chacune. • Un pré-filtre s’ajoute au filtre RLB pour tenir compte de l’effet de diffraction de la tête. 17 Niveau relatif (dB) Effet de diffraction de la tête • } 90° 0° Le haut-parleur est placé à un angle inférieur ou égal à 90° de l’oreille la plus rapprochée. 18 Niveau relatif (dB) Courbe de réponse du pré-filtre Fréquence (Hz) 19 Comparaison entre courbes de réponse 20 Algorithme multicanal – résultats des 2D Graph 1 trois tests 20 Objective Loudness, dB relatif (dB) objectif Niveau 15 Série 1 UIT 1st dataset Série 2 2nd dataset 3rd dataset Série 3 10 5 r = 0.977 0 -5 -10 -15 -15 -10 -5 0 5 10 Niveau subjectif relatif (dB) Subjective Loudness, dB 15 20 21 Le calcul de la sonie BS.1770 N SonieLKFS = -0.691 + 10 log10 Σ Gi · zi i • L’algorithme fut adopté par l’UIT en 2006 • GL, GR, GC = 0 dB; GLs, GRs = 1.5 dB • La pondération K fut désignée par l’UIT en 2007 pour indiquer l’ensemble du pré-filtre et du filtre RLB. • Le facteur de correction a deux fonctions: – corrige la réponse du filtre K à 1 kHz; – permet que LeqA et LeqK donnent, en moyenne, les mêmes valeurs pour des séquences de paroles. • L’unité de mesure de la sonie BS.1770 est LKFS 22 Désignation K • À ne pas confondre: la pondération K et le métrage K • La pondération K décrit une courbe de réponse en fréquence, au même titre que les pondérations A, B, C. • Le métrage K est un système qui unit l’échelle d’affichage du niveau de signal à un niveau d’écoute. Le système fut proposé par l’ingénieur de son Bob Katz pour promouvoir des pratiques de studio mettant l’emphase sur la sonie plutôt que sur les valeurs d’échantillons. Un K-mètre n’utilise pas nécessairement la technique BS.1770 pour mesurer le signal. ( www.digido.com/level-practices-part-2-includes-the-k-system.html ) 23 Résumé de la norme UIT-R BS.1770 • L’algorithme de calcul de sonie long-terme est le résultat d’une série de tests subjectifs. • L’algorithme permet une mesure juste d’une grande catégorie de sons: dialogue, musique, effets de son, etc. • Il prévoit la mesure des sons monophoniques et multicanaux. • Sa simplicité permet l’intégration de l’algorithme dans plusieurs classes d’appareils de mesure et de traitement. • Niveau d’échange: – UIT: -24 LKFS (adoption formelle prévue en mars 2010); – ATSC (A/85): -24 LKFS – P/Loud (UER): -23 ou -24 LKFS (pas encore de décision formelle); 24 True-Peak • Lacunes d’une valeur crête tirée directement de la valeur des échantillons: – lecture de niveau inférieure à la vraie valeur de la crête, risques d’écrêtage; – manque de consistance dans les mesures; – battements dans la lecture des niveaux. • Le niveau True-Peak est une meilleure indication de la valeur des crêtes du signal analogique. crête échantillon temps 25 True-Peak Fréquence Erreur potentielle (48 kHz) Erreur True-Peak (48 kHz) 1 kHz 0.02 dB 0.001 dB 10 kHz 2.01 dB 0.12 dB 15 kHz 5.11 dB 0.26 dB 20 kHz 11.74 dB 0.47 dB • Le sur-échantillonnage est employé pour calculer une valeur de crête plus juste. • L’algorithme incorpore un filtre facultatif pour simuler l’effet des circuits de suppression de la composante continue dans un signal analogique. 26 Merci 27