Abstracto
Níveis de sonoridade elevados sempre foram um atributo desejado pela maioria dos artistas e produtores, como “arma” e como meio de tornar a música que se pretende publicitar/vender mais popular. Quanto maior o nível de sonoridade tiver a música, mais esta sobressai do ruído ambiente e, consequentemente, mais atenção gera à sua volta.
Loudness War (LW), ou Loudness Race (LR), é a designação dada ao fenómeno que retrata a tendência da indústria musical contemporânea gravar, produzir e difundir música, em níveis de sonoridade progressivamente superiores, ao longo das décadas.
1. Introdução
O fenómeno LW pode ser observado em muitas áreas da indústria musical, particularmente em difusão audiovisual e em álbuns lançados em formato digital (CD, DVD, MP3, etc).
Nos casos dos conteúdos distribuídos em formato digital, o motivo que leva ao aumento do nível de sonoridade deriva do desejo dos artistas, assim como dos produtores, em criar música que soe o mais alto possível, ou mais alto do que a concorrência.
Com a evolução tecnológica dos meios de difusão (vinil, CD, DVD, MP3), também esta “guerra” acompanhou esse desenvolvimento (Figura 1).
Com a evolução tecnológica dos meios de difusão (vinil, CD, DVD, MP3), também esta “guerra” acompanhou esse desenvolvimento (Figura 1).
Figura 1 – Evolução do nível médio de sonoridade. [1]
Na figura 1, a barra a vermelho representa o aumento progressivo do nível médio de sonoridade, e a potencial perda de qualidade e fidelidade sonora.
2. Problemática
A música, assim como o discurso oral, é dinâmica. Durante a sua reprodução o nível de sonoridade varia significativamente. Existem momentos de sonoridade baixa e elevada, de modo a acentuar-se e transmitir-se conteúdo (significado) através dos relativos níveis de sonoridade.
Por exemplo, se uma pessoa está a falar normalmente e grita repentinamente, em adição ao contexto da mensagem, é transmitido um significado de urgência, surpresa, ou desagrado.
O processo de gravação em estúdio envolve uma etapa denominada masterização, que acontece após a gravação e antes do processo de fabrico, pelo que se pode dizer que é a última etapa no processo de gravação e ao mesmo tempo a primeira etapa no fabrico.
Normalmente as gravações de álbuns ocorrem durante meses, sendo cada faixa (música) gravada em momentos distintos, pelo que os níveis de igualização entre as faixas nem sempre são iguais. O engenheiro de som procura uniformizar o projecto com o uso hábil da equalização, compressão e outros recursos, de forma a:
- Cumprir com os requisitos do formato em que se pretende gravar o álbum (disco vinil, CD, DVD, etc);
- Manter o som consistente de uma faixa para outra;
- Garantir o resultado desejado num equipamento de reprodução de áudio comum.
Quando a GD de uma música é fortemente reduzida de modo a serem obtidos níveis de sonoridade superiores, o som transforma-se análogo à figura de alguém a gritar continuamente durante todo o seu discurso. Não só todo o impacto é perdido, assim como o nível elevado do som se torna fatigante para os ouvidos dos ouvintes.
Como a amplitude máxima da GD de qualquer suporte de gravação de som é limitada (tem um nível de sonoridade máximo fixo), a sonoridade global da música só pode ser aumentada se reduzida a GD. Isto é conseguido elevando o som de baixa amplitude para níveis de sonoridade superiores, assim como cortando ou diminuindo significativamente os níveis de som mais elevados (picos); removendo assim também conteúdo harmónico útil. As figuras 2 e 3 mostram a mesma pista masterizadas em décadas diferentes.
|
Figura 2 – Forma de onda representativa de gravações no final da década de 80, inicio da década de 90. [2] |
|
Figura 3 – Forma de onda representativa de gravações actuais. [2] |
A segunda forma de onda, não só tem uma amplitude (de sonoridade) maior que a primeira, assim como comprimida (a variação entre os valores mais altos e mais baixos é muito reduzida, ou seja, existe uma diferença reduzida entre os picos e o valor médio da forma de onda).
3. Relação sonoridade-audição
Estudos no campo da audição humana revelam que as pessoas avaliam o grau de sonoridade de uma dada música pela sua sonoridade média e não pelo seu pico de sonoridade. [7] Quer isto dizer que, embora possa haver duas músicas cujo pico de sonoridade atinja o mesmo valor, a música que mais capta a atenção do ouvinte é a que tiver maior valor médio de sonoridade.
Estudos também mostram que exposição a níveis de sonoridade elevados e monótonos é uma fonte de stress. [18]
4. Definições técnicas
4.1. Amostragem e Quantificação
Um dos processos a efectuar na digitalização dum sinal de áudio é a sua quantificação. Isto aproxima, por uma gama finita e limitada de valores discretos, a amplitude dum sinal contínuo no tempo:
|
Figura 4 – Sinal amostra e sua quantificação. [3]
|
|
Figura 5 – Sinal original e sua réplica digital. [3] |
Uma das aplicações da quantificação é a conversão dum sinal discretizado (sequência de amostras dum sinal contínuo no tempo) num sinal digitalizado.
Todos estes processos descritos são passíveis de serem executados em conversores analógico-digital com um número predefinido de bits atribuídos à quantificação.
A título de exemplo, num Compact Disc Audio (vulgo “CD”), o ritmo de amostragem é de 44,1 kHz e palavra de quantificação de 16 bit, o que leva a uma gama de 65 536 (2^16) valores possíveis por amostra.
4.2. Ruído de Quantificação
O ruído de quantificação reflecte a diferença entre o valor de amplitude (analógica) do sinal original e a sua respectiva amostra quantificada. Isto é devido ao arredondamento e truncamento dentro dos níveis de quantificação predefinidos.
Este tipo de ruído é não linear e intrinsecamente dependente do sinal original:
|
Figura 6 – Sinal original (azul) e quantificado (vermelho). [16] |
|
Figura 7 – Erro introduzido na quantificação da Fig. 3. [16] |
4.3. Gama Dinâmica (GD)
A GD descreve a razão entre o mais alto nível de sinal quantificado não distorcido (saturado) e o mais baixo nível quantificado (audível) ou nível de ruído, ou seja, é a diferença entre o nível mínimo e máximo de amplitude sonora (no caso em estudo) que um determinado dispositivo é capaz de captar ou reproduzir.
Em processamento digital de sinais (DSP), o nível máximo passível de se enquadrar dento da gama dinâmica disponível é definido pela dimensão da palavra de quantificação; quanto maior o seu número de bits maior a GD disponível.
A gama dinâmica é influenciada pelo ruído de quantificação. Com isto, o máximo teórico de GD para um sistema quantificador a Q bit/amostra:
|
(1) |
4.4. PCM (Pulse Code Modulation)
A modelação por codificação de impulso é a representação digital dum sinal cuja magnitude é amostrada periódica e uniformemente, seguido de quantificação e a respectiva saída de palavras binárias representativas do sinal original.
|
Figura 8 – Processo de codificação e descodificação PCM. [11] |
4.4. Compressão de Gama Dinâmica
Este processo de compressão é aquele que manipula a GD dum sinal de áudio em função de parâmetros predefinidos.
Um compressor não é mais do que um regulador automático de sonoridade (volume/amplitude), fazendo com que as componentes espectrais com maior sonoridade vejam a sua amplitude diminuída caso ultrapassem um limiar predefinido. Além disso, as componentes espectrais com menor amplitude (abaixo do limiar) não são manipuladas, fazendo com que a GD do sinal seja reduzida.
Exemplo:
- Factor de compressão: 3:1
- Limiar: -11 dB
- Nível da amostra de entrada: -2 dB (9 dB acima do limiar)
- Nível de saída: -7 dB (3 dB acima do limiar).
|
Figura 9 – Relação entre o nível do sinal de entrada e saída e factores de compressão. [17] |
Este procedimento é frequentemente utilizado para contornar limitações de equipamento, radiodifusão ou melhorar a recepção de sinais em ambientes acusticamente ruidosos.
A figura 10 ilustra diferentes técnicas de redução de GD e suas consequências na qualidade do sinal pós-processado.
|
Figura 10 – Diferentes técnicas de compressão de GD. [17] |
A saturação inerente a hard clipping (mais comum) distorce o sinal.
5. Contexto Histórico
5.1. Era Analógica
Um disco de vinil é um meio analógico de armazenamento de som, que consiste num disco liso de material policloreto de vinilo com uma fenda em forma de ‘V’, distribuída radialmente pelo disco (espiral). A reprodução do conteúdo do disco é feita através de um sistema electromecânico [4] (Figura 11), cuja agulha ao percorrer a fenda em forma de ‘V’, sofre vibrações que, depois de amplificadas, são reproduzidas. A gravação consiste então em ‘escavar’ a fenda de forma dinâmica de acordo com o som que se pretende gravar.
|
Figura 11 – Sistema de leitura e disco de vinil. [5] |
Consequentemente quanto maior o nível de sonoridade que se pretende produzir, maior será a amplitude das perfurações ao longo da fenda.
As editoras deram início à LW no princípio da década de 60, quando observaram que as músicas com maior nível de sonoridade tendiam a ganhar mais atenção das pessoas, comparativamente às músicas com nível inferior. Consequentemente, as editoras continuaram a aumentar o nível de sonoridade das suas músicas, no entanto, devido às limitações físicas dos discos de vinil, a tendência de aumento da sonoridade das músicas estagnou.
A masterização para discos de vinil, procurou sempre o equilíbrio entre o nível de sonoridade máximo possível e o tempo máximo de reprodução de cada pista. O aumento do nível de sonoridade nesta tecnologia tem como consequência o aumento da largura, assim como da profundidade, da fenda em forma de ‘V’. Como a área do disco é limitada e estandardizada, o tempo de reprodução é reduzido comparativamente ao mesmo conteúdo gravado com um nível de sonoridade inferior.
Para evitar o custo elevado de fabrico e produção de vários discos de vinil por álbum, os níveis elevados de sonoridade foram sacrificados em prol do tempo de reprodução total do disco.
A música ao vivo tem, tipicamente, uma GD de 120 dB, com picos da mesma ordem de grandeza de que um motor a jacto de um avião é capaz de produzir. Os discos de vinil típicos têm uma gama dinâmica de 70 dB, pelo que, para que a gravação de música em disco de vinil seja possível, é necessário reduzir a amplitude sonora global da música ou comprimir a mesma (baixar os picos de sonoridade para um nível inferior). Contudo, o nível de compressão analógica possível na época era limitado, devido à falta de tecnologia capaz de comprimir conteúdos analógicos com fidelidade.
5.2. Era Digital
A era digital veio permitir a total normalização de faixas para um elevado nível de sonoridade. {1}
Com a chegada do CD ao mercado (inicio da década de 80), havia várias razões para as comunidades audiófilas [8] se mostrarem extremamente receptivas ao áudio digital:
- Eliminação de ruídos causados pela deformação ou destruição da superfície de reprodução do disco (pó, riscos, corrosão, etc);
- Maior gama dinâmica de sonoridade disponível;
- Maior tempo de reprodução.
|
Figura 12 – Leitor de CDs Shanling CD T-100. [24] |
O CD (a 16 bit/amostra) suporta uma GD de aproximadamente 96 dB (1). Na década de 1980, o CD era um produto topo de gama (high-end), no entanto, devido ao facto de a generalidade dos produtores e engenheiros de som não terem acesso a tecnologias de pré-processamento digital, os álbuns lançados em CD tendiam a aproveitar, de uma melhor maneira, a gama dinâmica disponível.
Ao contrário dos discos de vinil, que têm um limite máximo de sonoridade dependente das características físicas do próprio disco, o CD tem o limite máximo de sonoridade definido pelo tamanho da palavra de quantificação (16bit), da codificação PCM.
A estandardização do CD-Audio foi especificada pelo consórcio Sony e Philips através do Red Book [9]. Foi estabelecido um ritmo de amostragem de 44,1 kHz, com uma palavra de 16 bit por amostra. Tendo em conta (1), a GD é fixa em 96,33 dB.
O valor máximo de amplitude (0111111111111111) [21] ficou referenciado a 0 dBFS [6] (Figura 13).
|
Figura 13 – Gama Dinâmica em escala dB Full Scale. |
Na década de 80, os CDs eram masterizados com um valor RMS, ou valor médio de sonoridade, de entre -20 dBFS até -18 dbFS, correspondendo aos picos de sonoridade, uma amplitude de aproximadamente -6 dBFS [2].
Com o natural aumento das produções e lançamentos de álbuns em formato CD, veio uma nova LR, pelas mesmas razões que anteriormente se tinham verificado no formato disco de vinil – cada produtor queria que a sua música se destacasse em relação à concorrência.
Nos finais da década de 80, as músicas nos CDs eram já masterizadas de tal forma que os seus valores máximos de sonoridade atingiram uma amplitude de 0 dBFS. Chegado a este ponto, a única maneira de elevar o valor médio de sonoridade de uma música, sem cortar os valores máximos de amplitude (sem perder informação por exceder os limites impostos por 16 bit/amostra), era comprimir os picos de sonoridade.
Na década de 90 foram observados níveis médios de amplitude de álbuns desde -15 dBFS até -6 dBFS (nos piores casos) [2]. No entanto a maioria das músicas, nesta década, permaneceu com um valor médio de sonoridade de aproximadamente -12 dBFS [2].
A presente década revela-se, como o auge da LW. Desde a década de 80 até agora, o valor médio de sonoridade dos CDs aumentou dez vezes mais, e os picos de som são agora um décimo do que eram [2].
6. ‘Hotdisks’
Ao longo das últimas décadas, foram surgindo álbuns no mercado que ficaram marcados publicamente pela sua extrema compressão de GD. Este núcleo é denominado “hotdisks”. Alguns exemplos em mastrizaçao de qualidade inferior (no âmbito LW) [19] [25] [26], cujos níveis de distorção foram causa de algumas manifestações públicas de descontentamento [20] e criação de associação [22]:
- Christina Aguilera – Back to Basics;
- Lily Allen – Alright, Still;
- Arctic Monkeys – Whatever People Say I Am, That's What I'm Not;
- The Flaming Lips – At War with the Mystics;
- Los Lonely Boys – Sacred;
- Sir Paul McCartney – Memory Almost Full;
- Muse – Black Holes and Revelations;
- Queens of the Stone Age – Songs for the Deaf;
- Red Hot Chili Peppers – Californication;
- Santana – Supernatural;
- Sting – Brand New Day;
- The Stooges – Raw Power (1997 remix);
- Depeche Mode – Playing the Angel;
- Black Eyed Peas – Elephunk;
- The Chemical Brothers – The Golden Path Single;
- Radiohead – Amnesiac;
- Stooges – Search and Destroy (Sony Record, 1997)
A título de exemplo, os dois últimos álbuns citados:
|
Figura 14 – Diagrama de forma de onda da pista Radiohead – “Dollars And Cents” (2001). [25] |
|
Figura 15 – Diagrama de forma de onda da pista Stooges – “Search and Destroy” (1990). [25] |
|
Figura 16 – Diagrama de forma de onda da pista Stooges – “Search and Destroy” (1997). [25] |
Note-se, na figura 15 e 16, a diferença de GD na remasterização da mesma pista, 7 anos após a primeira edição.
7. Soluções
Contudo, existem algumas soluções [10] para esta problemática:
7.1. No lado do consumidor
A implementação de sistemas de som com conversores digital-analógico capazes de reconstrução heurística das formas de onda distorcidas por saturação à falta de GD.
Outra solução pode passar por pós-processamento através de software. Existem soluções no mercado que permitem, à semelhança a recomendação anterior, reconstruir heuristicamente formas de onda cujo conteúdo foi parcialmente destruído, seja em offline [13] [14] [15] ou em tempo real [12].
Pode também passar pela compra de edições em discos de vinil ou DVD-Audio (24 bit/amostra ~ 144 dBFS (1); maior GD disponível).
7.1. No lado de produção de conteúdos
Mudança de mentalidade por parte dos produtores e masterizadores, a ponto de levar à redução dos níveis de sonoridade, sem exceder os limites físicos dos meios de difusão actuais.
Outra alternativa passa pelo processo de masterização, havendo monitorização das formas de onda para evitar saturação (clipping) [17] [27] e sem penalização de gama dinâmica.
{1} “A invenção do formato digital de áudio e do CD tornou-se num novo combustível para uma, já existente, Loudness Race” [Bob Katz] – reconhecido masterizador.
|