Accueil du site > Technique > Le Loudness au quotidien

Le Loudness au quotidien

dimanche 1er mars 2009

Partager l'article avec  

La mesure du niveau électrique est aussi vieille que l’électroacoustique mais, si elle a rempli son rôle pour les enregistrements et les transmissions, elle n’a pas réussi sa mission avec les oreilles humaines car la corrélation entre niveau électrique et niveau sonore perçu n’est pas linéaire. Tous les acteurs de l’audiovisuel ont bien compris la nécessité d’une mesure plus physiologique et en font leur credo.

Alors, aujourd’hui, serpent de mer ou réel progrès ?

par Alain DAVID (Son 1972)

- Mesure électrique

La mesure du niveau date du VU-mètre, normalisé en 1942 pour la téléphonie et ré-employé en radio, avec un appareil qui mesurait la puissance. Le VU-mètre (figure 1) réalisait sans le vouloir une mesure de Loudness en intégrant la tension sur un temps de 300 ms : parfait pour équilibrer l’orchestre de Glenn Miller avec le présentateur de l’émission radiophonique. L’emploi de tubes avec leur forte tension d’alimentation rendait floue la tension maximale supportée et les crêtes non lues par le VU étaient "arrondies" lors des transmissions. L’arrivée des transistors et surtout de l’audio numérique a rendu très précise la tension maximale (le Full Scale du numérique), tension ou nombre au-delà duquel le circuit devient hautement non-linéaire : c’est la saturation avec son lot de distorsions.

PNG - 14.9 ko
Figure 1 - Le VU historique

Des musiques nouvelles, des circuits avec plus de bande passante et des crêtes de modulation qui passent mal ont généralisé l’emploi du crête-mètre pour mesurer le programme, le PPM. L’archétype le plus connu est le Sample Peak Program Meter (figure 2), appelé aussi crête-mètre numérique, qui équipe la quasi-totalité des appareils numériques et qui montre la valeur de l’échantillon sur une échelle en dBFS, c’est à dire avec la valeur maximale (le Full Scale) en haut de l’échelle.

PNG - 5 ko
Figure 2 - Echelle d’un S-PPM (source RTW)

Les lois (obligations CSA pour la radio FM) et recommandations (PAD des chaînes) pour la diffusion analogique sont toutes basées sur la mesure du niveau électrique même avec l’utilisation généralisée du Quasi PPM à la norme DIN 45406 (figure 3) avec un zéro décalé et un temps de montée de 10 ms. On enchaîne ainsi des programmes dont la seule référence est le niveau électrique maximal :

- 75 kHz de déviation maximale en modulation FM,

- 0 dBFS pour la gravure des CD (en l’absence de bon sens et d’organisme de référence pour la musique),

- Permited Maximum Level à -9 dBFS (soit 0 dBr mesuré sur DIN 45406) pour le broadcast.

PNG - 5.6 ko
Figure 3 - Echelle d’un Q-PPM (source RTW)

- Le revers de la médaille

Jusqu’à juin 2008, les programmes 2 canaux (mono, stéréo Lo Ro et matricés Lt Rt) étaient mesurés et calibrés par leur niveau maximal. L’inconvénient de cette procédure est qu’elle favorise les programmes à faible dynamique. La raison est simple : considérons une gamme étendue de programmes telle que ceux de la figure 4. Chacun est mixé en fonction d’un niveau de bruit lors de la restitution (il y a plus de silence dans une salle de cinéma pour écouter un film que dans une voiture pour écouter un CD) et aussi d’autres facteurs esthétiques.

PNG - 18.8 ko
Figure 4 - Echantillon de programmes

Si maintenant, on normalise à la même valeur tous ces programmes par leurs crêtes, on constate sur la figure 5 que la valeur moyenne du niveau est d’autant plus élevée que la dynamique est faible. Nous l’avons vécu avec les spots publicitaires à la fin des années 90 et nous le constatons toujours sur les CD. Comme un programme plus fort donne un sentiment de meilleure intelligibilité et de basses plus amples, la tentation est forte (pour ne pas dire irrésistible) d’être plus fort que le concurrent. Puisque le législateur a donné une limite au niveau électrique, la compression, mono ou multibandes, permet de réduire la dynamique et de continuer à monter le niveau sonore perçu.

PNG - 20.5 ko
Figure 5 - Programmes normalisés

Dans le même temps, les services Qualité des chaînes de TV et de radio se rendent bien compte que la qualité se dégrade et que trop de compression fatigue l’auditeur qui zappe. Le résultat final est le même si tous les programmes ne s’enchaînent pas au même niveau. Alors que faire ?

- Mesure physiologique

D’une part, l’oreille humaine est sensible à la puissance c’est à dire au temps pendant lequel est produite une certaine énergie (donc un certain niveau électrique). Ce n’est pas tant le niveau qui est important mais le temps pendant lequel il existe : il faut intégrer (figure 6) le paramètre Temps dans la mesure (comme le faisait ce bon vieux VU). Cette intégration peut se faire d’une courte durée (env. 500 ms), à une durée moyenne (10 à 20 s) jusqu’à la totalité du programme. On obtient une mesure en niveau équivalent Leq généralement graduée en dBFS.

PNG - 12.3 ko
Figure 6 - Niveau équivalent Leq

D’autre part, l’oreille n’est pas linéaire en fréquence et coupe les basses allègrement. Ce phénomène bien connu a été modélisé par des courbes de pondération (A - B- M - C - D - ISO), différentes selon le niveau d’écoute. Par exemple, en 2001 la CST a émis une recommandation concernant les films publicitaires et les bandes-annonce basée sur la pondération M (LeqM) - figure 7. Le Dolby Digital comporte, depuis sa normalisation pour le DVD, une mesure du niveau en pondération A (LeqA) - figure 8.

PNG - 15.4 ko
Figure 7 - Pondération A
PNG - 16.8 ko
Figure 8 - Pondération M

Toute méthode qui intègre un temps long et une pondération spectrale vise à simuler la perception humaine. On l’appelle alors mesure du Loudness.

La méthodologie se complique quand on cherche à mesurer une partie représentative du programme. C’est ce que fait Dolby avec le Dialog Level qui est la mesure du niveau perçu sur la parole, suite aux constatations que les auditeurs règlent le volume d’après la parole pour en avoir une bonne compréhension. Comme il est long de choisir les passages parlés représentatifs (et que ce choix est soumis au libre arbitre de chacun), Dolby a inventé un algorithme, le Dialog Intelligence, qui fait lui-même le tri (donc de manière répétitive). Le problème de cette méthode est celui créé par l’absence de dialogue dans un programme purement musical.

PNG - 20.9 ko
Figure 9 - Dialog Intelligence de Dolby

- Validité de la mesure

Chacun prêchant pour sa paroisse, il n’est pas facile de se forger une opinion indépendante. Une étude indépendante a été réalisée par l’université McGill de Montréal avec 38 heures d’écoute cumulées sur 147 programmes de différents types (parole, musique, guitare, scène de bataille, etc…). Le résultat (figure 10) a été présenté plusieurs fois sur les sites de l’UER, de TC Electronic et de l’AES.

PNG - 27.5 ko
Figure 10 - Déviation subjective de différentes pondérations (source McGill / TCE)

Ce tableau montre la déviation subjective en dB entre une mesure d’un programme et la perception du niveau de ce programme par un auditeur. Les barres bleues horizontales ont une largeur proportionnelle au nombre de programmes ayant cette déviation. La largeur pour 15 programmes est montrée en haut à gauche. Les 3 lignes horizontales, formant des rectangles, délimitent les zones 50 % de chaque côté (ligne du milieu), 25 % au-dessus (ligne supérieure) et 25 % en dessous (ligne inférieure). En rouge au-dessus, le nombre de programmes qui ont une déviation supérieure à 6 dB.

On constate que les pondérations ISO, D, A et M font moins bien que pas de pondération du tout. En dehors des 2 pondérations propriétaires de gauche (TC Electronics), la pondération qui décrit le plus fidèlement la sensation du Loudness est celle dite RLB. L’Union Internationale des Télécoms Radiodiffusion ITU-R a initié en 2000 un groupe de travail su la mesure du Loudness qui a abouti à une norme internationale en 2006 sous le nom de ITU-R BS.1770. Cette norme, fondée sur des travaux solides (ceux de Soulodre en particulier) et reconnue par tous les acteurs des télécommunications (radio et TV compris), s’est rapidement imposée.

- Loudness RLB

La norme ITU s’applique à tous types de programmes audio ou audiovisuels, en format monophonique, stéréophonique et multicanal (5.1 formellement). La mesure porte sur tous les canaux pleine bande (donc pas le LFE) et se décompose en 3 parties :

- une pondération modifiée de la courbe B, lui donnant son nom initial Revised Low frequency B-curve RLB,

- un préfiltrage accentue les aigües de 4 dB au dessus de 3 kHz pour tenir compte de l’influence acoustique de la tête humaine en stéréophonie et en multicanal, lui donnant son nom actuel R2LB (figure 11),

- une sommation du Loudness de chaque canal avec un gain de 0 dB pour les canaux frontaux et de 1,5 dB pour les canaux Surround, pour tenir compte de la psychoacoustique humaine.

PNG - 13.7 ko
Figure 11 - Pondération R2LB (K)

On obtient au final une seule valeur représentative du programme. La révision BS.1770-1 de 2007 a apporté quelques précisions. La pondération R2LB porte maintenant le nom officiel de pondération K. La valeur finale, en dB Leq(K), peut s’exprimer de 2 façons :

- soit par rapport au Full Scale, notée LKFS ou LFS, allant généralement de 0 à -60. Cette mesure est comparable à celle du DialNorm de Dolby.

- soit par rapport à une référence internationale, notée LU, allant généralement de 9 à -21 (figure 12).

A la connaissance de l’auteur, et en date du 15 août 2008, cette référence internationale n’a toujours été fixée. Les fabricants d’équipement de mesure ont laissé ce paramètre réglable avec la valeur de -18 dBFS (Alignement Level de l’UER) comme valeur par défaut. On obtient alors des valeurs plus petites de 18 dB, avec 0 LU comme objectif.

PNG - 4.2 ko
Figure 12 - Bargraph en LU (source TCE)

Pour vérifier la pondération de votre afficheur, il suffit d’y envoyer un 1 kHZ (précisemment) à 0 dBFS. Si votre afficheur vous retourne un Loudness à -3 LFS, c’est qu’il est à la nouvelle norme (ou alors il est passablement déréglé). C’est la préfiltrage des hauts médium qui est la cause de ce décalage, tout à fait normal.

- Afficheurs Loudness

Indépendamment de la pondération, l’ITU a spécifié un type d’afficheur True-Peak dans sa norme BS.1771. Lors de la conversion N/A, le niveau électrique peut être plus élevé de 3 dB que les mots numériques. Le sur-échantillonnage x4 permet de voir le véritable niveau de sortie. En parallèle, l’échelle est par pas de 1 dB (Type I) ou de 3 dB (Type II) graduée en LFS ou en LU. Un exemple chez TC Electronic est donné figure 17.

Une donnée importante, laissée au choix du technicien, est le temps d’intégration. La plupart des constructeurs ont décidé d’afficher plusieurs mesures simultanément. Ainsi RTW (figure 13) affiche-t-il le Loudness global intégré sur 500 ms (indicateur momentané M), sur 20 s (Intégré I) et sur une durée paramétrable de 1 heure à 1 jour (long terme L) en plus des Loudness momentanés individuels.

PNG - 6.8 ko
Figure 13 - Intégration des Loudness (source RTW)
PNG - 51.7 ko
Figure 14 - Afficheur complet de TC Electronic

TC Electronic (figure 14) a choisi une représentation différente avec un bargraph circulaire pour la mesure momentanée, un chiffre pour indiquer la valeur intégrée SLM Standard Loudness Measure, ou Centre of Gravity, mesurée sur une durée paramétrable (non significative en dessous de 10 s) et un autre intéressant, le CLM Consistency Loudness Measure pour indiquer les variations intrinsèques du Loudness. L’historique (de 1 min à 24 h) est montré au centre sous une forme de radar.

Tous les équipements Dolby ont été upgradés cet été pour utiliser la nouvelle pondération K. Comme seule la pondération a changé, rien n’est visible en surface si ce n’est la révision de logiciel. La correspondance du Loudness ITU avec le DialNorm de Dolby est assurée par la mesure I de RTW ou CLM de TCE. La grosse différence vient du fait que la métadonnée DialNorm est valable pour l’ensemble du programme (figure 15). C’est là que la connaissance de la Consistency permet de savoir si le Loudness sera très éloigné du Dialog Level (un écart de 3 dB représente une valeur saine, 15 dB d’écart obligeront l’auditeur à jouer de la zapette en permanence en l’absence du DRC Dolby). Une valeur positive du CLM indique que la dynamique n’a pas besoin d’être retouchée et donc que Dialog Level et Loudness sont voisins.

PNG - 29.9 ko
Figure 15 - Un seul chiffre décrit mal l’ensemble du programme (source TCE)

- Comment agir sur le Loudness ?

L’ampleur de la transmission numérique (TNT, HD, VoD, TMP, T-DMB, DAB+, Internet, etc …) amène une grande compétition entre programmes diffusés et entre diffuseurs de programme. Comme il est déjà prouvé que l’on ne peut pas augmenter la compression sans perdre des auditeurs et que le niveau électrique est fixé par décret du CSA, il ne reste plus qu’à jeter les armes et se mettre d’accord. D’où l’ampleur du mouvement actuel en faveur d’une méthode commune de Loudness et d’une valeur commune.

La première option est de supprimer la compétition entre programmes en les ramenant tous à la même valeur de Loudness décidée par la Direction Technique ou par le Service Qualité. C’est la voie prise par certaines chaînes qui mettent en place une normalisation avant émission. Elle permet de s’affranchir du type de diffusion (HD, SD, Internet) et du type de codec (MPEG2, Dolby Digital, MPEG4). Ce sera probablement la voie choisie par les grands opérateurs de radio numérique, T-DBM et DRM, car ils y travaillent ardemment. On peut aussi, comme NRJ12, normaliser tous ses programmes avant diffusion pour que le traitement d’antenne agisse toujours de la même façon.

Il faut rappeler que la méthode Dolby consiste à mesurer le Loudness, ou le Dialog Level, et à introduire cette donnée dans le flux codé. C’est le décodeur Dolby Digital de l’auditeur qui fera la normalisation (à -31 dBFS). Mais cela suppose un décodeur Dolby à la réception, ce qui n’est pas le cas du MPEG2 de la TNT ni du MPEG4 du T-DMB. D’où l’intérêt croissant pour agir sur le programme lui-même à la source.

PNG - 46.9 ko
Figure 16 - Dolby Media Meter

Pour aider à mesurer le Loudness des programmes enregistrés, de nombreux appareils sont apparus récemment qui analysent les fichiers. Le Dolby Media Meter (figure 16) est un logiciel sur Mac et PC qui analyse les fichiers codés ou non pour donner son verdict (et le comparer avec la métadonnée DialNorm si le fichier était déjà codé DD, DD+, DE ou TrueHD). Le LM5D de TC Electronic (figure 17) est un plug-in pour ProTools fait le même type de mesure mais sans la fameuse option Dialog Intelligence qui fait gagner tant de temps (non facturable) aux laboratoires.

PNG - 35.1 ko
Figure 17 - LM5D de TC Electronic

Pour aider à modifier le Loudness (normalisation à une valeur cible), il existe au moins 2 équipements. L’un purement Dolby, le DP600, est destiné aux applications lourdes d’ingest dans un serveur d’acquisition. Il sait travailler en réseau sur tous types de fichiers WAV ou codés pour faire une mesure, modifier la métadonnée ou modifier le niveau. L’autre est AWE (figure 18), un logiciel de Minnetonka qui utilise un plug-in de Dolby. Il automatise une chaine de production en lisant des fichiers WAV depuis un Hot Folder et en les mesurant, les normalisant ou les encodant. C’est aussi un compagnon de ProTools pour les labos. Ces équipements ont aussi l’avantage de mettre moins de pression sur les mixeurs Film et Téléfilm qui ont parfois des relations "délicates" avec les responsables de vérification PAD pour 1 dB de plus ou de moins. Rome ne s’est pas faite en un jour !

JPEG - 37.7 ko
Figure 18 - Analyseur et normalisateur de Loudness AWE (source Minnetonka)

La deuxième option est la normalisation entre diffuseurs. Dans la mesure où ils s’espionnent tous les uns les autres par analyseur LM100, c’est un vœu pieux. Mais le CSA s’inquiète beaucoup des problèmes de niveau inter-programmes et pourrait légiférer, ce qui règlerait le problème inter-diffuseurs. Pour l’instant, ils coopèrent au sein de la FICAM et de la CST (la RT19 est en phase finale de validation) pour aboutir à des Recommandations communes. Mais une recommandation s’impose avec moins de force qu’un décret !

PNG - 87.3 ko
RTW 31900, analyseur complet en 5.1

P.-S.

- Remerciements à Thomas LUND, TC Electronic, pour la qualité et l’abondance de ses White Papers sur le Loudness,

a.david @ realisason.com