Fechar Notificações

Não perca mais nada!

Ative as notificações do blog para ser avisado sempre que tiver conteúdo novo!

Fechar Newsletter

JUNTE-SE A MILHARES DE EMPREENDEDORES DIGITAIS!

Receba os melhores conteúdos para crescer seu negócio online.

Fechar Black Week Hotmart

Quer fazer mais vendas? Participe da Black Week Hotmart. Nos últimos anos, os números foram impressionantes: aumento de 200% em vendas em um único dia!

Quero participar

Conheça os principais parâmetros para garantir a qualidade de áudio do seu produto digital

Conheça os principais parâmetros para garantir a qualidade de áudio do seu produto digital

Você sabe as diferenças entre formatos? Entende como funciona a taxa de compressão? Entenda esses e outros parâmetros no artigo!

Configurações de áudio para gravadores ou interfaces de som podem ser bastante confusas. Mas se você vai trabalhar com vídeos ou podcasts, é bom saber como interpretar esses parâmetros ao gravar e exportar arquivos, seja no Audacity (gratuito), Reaper, Adobe Audition ou mesmo em editores de vídeo.

Aqui vamos falar sobre diferenças entre taxas de amostragem (sample rate), resolução (bit depth), taxas de compressão de arquivo e inclusive variações de formatos. Assim, você vai ficar mais seguro de suas escolhas em relação à qualidade de áudio e garantir bons resultados.

Resumindo, você vai entender porque recomendamos gravar em formato não comprimido (WAV, por exemplo) em 24 bits e 48 kHz. Além disso, também saberá o motivo de, na maior parte dos casos, não precisarmos mais do que um MP3 de 192 kbps para exportar áudio de ótima qualidade.

Falaremos ainda sobre a possibilidade de maior compressão em arquivos de podcasts, que podem ser gerados em MP3 de 64 kbps, mono, facilitando o consumo online.

Formatos, extensões e codecs: o que significam?

Ao lidar com arquivos de áudio, podemos falar em formatos, extensões e codecs. Em uma explicação simplificada, o formato nada mais é que o tipo de arquivo, identificado por sua extensão (*.mp3, *.wav, *.ogg, *.wma etc), que muitas vezes já nos diz como aquele arquivo foi codificado – ou qual o seu codec.

Como exemplo, um arquivo no formato MP3 possui a extensão *.mp3 e codec MPEG-1 Audio Layer III.

Qualidade do áudio - Exemplos de extensões de arquivos de áudio
Exemplos de extensões de arquivos de áudio

Normalmente essas terminações se misturam, mas o que importa saber é que, assim como nos vídeos, arquivos com o mesmo tipo de extensão nem sempre possuem o mesmo codec e vice versa.

Essa informação é válida para você não ficar perdido caso não entenda o motivo de um software que normalmente toca seus arquivos *.m4a de repente se recusar a tocar um outro de mesma extensão, por exemplo.

Uma situação do tipo poderia indicar que os codecs utilizados foram diferentes. No caso, a solução seria usar outro software para ler o arquivo ou realizar uma conversão (nova codificação), que pode ser feita até mesmo em editores de vídeo.

Essas variações de formatos e codecs dependem das escolhas das empresas que desenvolvem os softwares que rodam os arquivos. Aí, muita coisa entra em jogo, como especificidades técnicas e até relações com patentes.

Já sobre os arquivos, eles costumam ser divididos em dois tipos: sem compressão ou comprimidos.

Arquivos sem compressão

Equipamentos de gravação de áudio dedicados costumam nos dar opções de gravar arquivos sem nenhuma perda de informação. Esses arquivos – não comprimidos – podem ser gerados em vários formatos e extensões, como WAV, AIFF, FLAC e ALAC. Para quem é familiarizado com fotografia, são equivalentes ao RAW ou DNG.

Já que costumam ser bastante pesados, a utilização desses formatos sem perdas (lossless) no produto final só é recomendada em alguns casos, como:

  • quando o produto final poderá ser processado pelo consumidor (arquivos destinados a bancos sonoros, por exemplo);
  • quando ocorrerá gravação em mídia física (CD, DVD e Blue-Ray);
  • ou para mercado de audiófilos (por uma questão de valor percebido e garantia de alta qualidade).

Entretanto, mesmo que você não tenha interesse em finalizar o processo com um WAV (um dos mais comuns), os formatos lossless podem ser bastante úteis na etapa de edição. Por comportarem muita informação, eles suportam alterações mais extremas sem degradar o som, impactando na qualidade de áudio.

Assim, por meio de plugins, conversões e processamentos, é possível manipulá-los de maneira mais livre, garantindo ótima qualidade, mesmo se posteriormente for gerado um arquivo comprimido.

Arquivos comprimidos

A maior parte dos equipamentos disponíveis no mercado (câmeras, celulares e até gravadores de áudios) costuma entregar arquivos já comprimidos. Esses arquivos são mais práticos, fáceis de processar e demandam menos espaço de armazenagem, possuindo tamanhos bem reduzidos (em bytes).

Alguns exemplos desses formatos são: 3GP, AAC, M4A, OGG, WMA e o MP3, que é sem dúvidas o mais conhecido. Esses arquivos são como o JPEG ou GIF no campo das imagens.

Por meio de um complexo algoritmo, tais arquivos são gerados buscando manter apenas informações relevantes para nossos ouvidos. Dependendo do modo de compressão, podemos gerar um MP3 a partir de um WAV e ter um arquivo 10 vezes menor, sem alterações perceptíveis no som.

Qualidade do áudio - Comparação de tamanho MP3 e Wave
Comparação de tamanho MP3 e Wave

Por falar em MP3, apesar de sua grande popularidade, atualmente ele é considerado um formato obsoleto, já que outros como o ACC (extensão .acc ou .m4a) possibilitam arquivos ainda menores e com mais qualidade.

Ainda assim, o MP3 continua a ser amplamente utilizado, pois grande parte dos softwares e equipamentos foram desenvolvidos visando tal formato. É por isso que para falar de taxas de compressão vamos utilizá-lo como exemplo.

Taxa de compressão: qual é a relação com a qualidade de áudio?

Agora que você já entendeu que um arquivo pode ser comprimido e ainda manter qualidade de áudio suficiente para nossos ouvidos, você precisa saber que esse nível de compressão pode variar bastante.

É pelo valor da taxa de compressão (ou bitrate) que conseguimos controlar o tamanho do arquivo e, consequentemente, a qualidade de áudio.

Por exemplo, um MP3 de 320 kbps (kilobits por segundo) pode soar tão bem quanto o áudio não comprimido de um CD ou DVD. À medida que se abaixa o valor do bitrate, menor fica o arquivo, mas perdas sonoras passam a ser perceptíveis, dependendo do áudio em questão.

Qualidade do áudio - Player Winamp mostrando a taxa de compressão de um MP3

Player Winamp mostrando a taxa de compressão de um MP3

Para se ter uma noção de como essa taxa afeta a qualidade de som, veja as referências:

  • 320 kbps – áudio indistinguível da qualidade de um CD;
  • 192 kbps – sem perdas significativas para a maioria das pessoas;
  • 128 kbps – perdas ligeiramente perceptíveis;
  • 96 kbps – qualidade similar a de rádio FM;
  • 32 kbps – similar à rádio AM;
  • 16 kbps – similar à rádio de ondas curtas (“walkie-talkie”).

Lembrando que os valores e descrições acima são apenas uma aproximação, pois a compressão de arquivo age de maneira distinta em cada tipo de áudio. Quanto mais informação perceptível (ou quanto mais complexo for o áudio em questão), mais margem haverá para a compressão afetar a qualidade.

É por isso que para um podcast sem trilha sonora pode não ser problema gerar um arquivo de apenas 64 kbps, mono – com um único sinal de áudio tocando simultaneamente nos canais da esquerda (L) e direita (R).

No entanto, uma música bem produzida em estúdio, tocada com vários instrumentos diferentes, pode sofrer perdas perceptíveis mesmo se o arquivo comprimido for de 128 kpbs, estéreo – com um sinal diferente para cada caixa, direita e esquerda.

Aqui estamos falando de taxas de compressão fixas (CBRconstant bitrate), mas há ainda a possibilidade de gerar arquivos com taxas variáveis, como as chamadas VBR (variable bitrate) ou ABR (average bitrate).

No VBR, o algoritmo analisa o áudio e decide em quais partes pode comprimir de maneira mais agressiva e em quais deve tirar menos informação. O ABR age de modo similar, porém se mantém na média da taxa estipulada previamente. Esses dois métodos, apesar de mais inteligentes, podem gerar incompatibilidade com alguns players.

Quando falamos sobre compressão x qualidade, lembre-se que não há regras: cada caso é um caso e é preciso avaliá-los individualmente para saber até que ponto as perdas são aceitáveis, ou quando vale a pena abrir mão da qualidade em prol da facilidade de uso (download mais rápido ou menor impacto de armazenamento, por exemplo).

Lembre-se que alguns sites e serviços recodificam o áudio após você fazer upload. Como não temos controle sobre esse processo, pode ser uma boa ideia enviar arquivos com qualidade um pouco acima do necessário para que se tenha uma margem de segurança no caso de novas conversões.

Resolução de amplitude: 16 bits ou 24 bits?

Se você for utilizar uma interface/placa de som ou um gravador dedicado, vai se deparar com opções de valores de bit depth. Isso está relacionado ao padrão de áudio digital PCM e não se aplica a arquivos comprimidos.

Os valores dizem respeito à relação sinal-ruído. Em outras palavras, tem a ver com dinâmica, ou níveis de volume que o arquivo consegue registrar com qualidade de áudio.

É como se fosse uma resolução de amplitude do som. Assim, em teoria, um áudio em 16 bits consegue representar 65.536 níveis de volume entre o valor mais baixo e o mais alto da escala. Já em 24 bits, há 16.7 milhões de gradações.

 

Qualidade do áudio - Representação ilustrativa de resolução de amplitude

Representação ilustrativa de resolução de amplitude

Apesar da grande disparidade numérica, na prática não se trata de uma variação perceptível aos nossos ouvidos. Porém, existe uma diferença técnica que pode, em alguns casos, dar vantagem ao arquivo 24 bits no momento de captação e edição.

Sabemos que devemos ter cuidado com o nível de entrada ao gravar, para que o áudio não “estoure” (gerando clipping). Isso é o que acontece quando deixamos o medidor gráfico subir demais, chegando a passar de 0 dB (valor máximo antes de ocorrer saturação/distorção digital). Por isso, deve-se respeitar uma certa margem de segurança, chamada “headroom”.

Em 16 bits, além desse cuidado, recomenda-se também ficar atento para que o nível de entrada não se mantenha muito baixo.

O motivo é que como não há resolução suficiente para registrar com exatidão sinais extremamente fracos, esses sons podem soar distorcidos digitalmente ou serem acrescidos de ruídos, através de um processo chamado dithering, que busca mascarar essas falhas de quantização.

Desse modo, como o arquivo em 16 bits registra menos gradações de volume (48 dB a menos em relação ao 24 bits), teoricamente corre-se o risco de, ao subir o volume no software, você se deparar com uma maior dose desses “chiados”. Em 24 bits, tecnicamente já não há esse risco.

Qualidade do áudio - representação ilustrativa das zonas de um medidor gráfico de áudio

Representação ilustrativa das zonas de um medidor gráfico de áudio

Apesar disso que foi falado, você com certeza vai se deparar com uma quantidade de ruídos (noise floor) provenientes de diversas fontes muito mais prováveis como: cabos, rede elétrica, pré-amplificadores, microfones, componentes de baixa qualidade, ruídos do próprio ambiente (“ruído de sala”) e até decorrentes do funcionamento natural do equipamento utilizado (alguns fabricantes até especificam o valor no manual).

Assim, na prática, valores de bit depth provavelmente não influenciarão sua gravação de modo relevante. Então, se seu equipamento só suporta 16 bits, fique tranquilo, afinal é o mesmo valor de bit depth de um CD de áudio, que como se sabe, pode apresentar som cristalino para a maior parte dos usos.

No entanto, como um arquivo 24 bits não fica muito mais pesado do que um em 16 bits, vale a pena gravar nesta resolução mais alta sempre que possível. Além de se garantir uma margem de segurança maior ao processar o arquivo digitalmente, 24 bits é o padrão do DVD e Blue-Ray. Desse modo evita-se conversões desnecessárias, caso o áudio final vá para uma dessas mídias físicas.

Hoje em dia já existem até equipamentos que trabalham em 32 bits, mas, como vimos, dificilmente você se beneficiaria de algo do tipo, pois se trata de uma opção para casos específicos.

É o caso, por exemplo, de quando o som é criado diretamente dentro do computador – sem passar por toda uma parafernália analógica, que acaba adicionando diversos ruídos no processo.

Taxa de amostragem: o que esse valor nos diz?

Outros valores que você vai se deparar são relativos à taxa de amostragem (ou sample rate). Esses números são relativos à quantidade de vezes, por segundo, que o som analógico é “registrado”, para ser reconstruído digitalmente (44.1 kHz é igual a 44.100 amostras por segundo). É como se fosse a quantidade de quadros (frames) por segundos, em vídeo, necessários para que nossos olhos criem ilusão de movimento.

Esses valores também dizem respeito à frequência máxima (som mais agudo) possível de se reproduzir no arquivo.

Para deixar mais claro, convém lembrar que quanto mais grave um som (baixa altura tonal), mais baixa é sua frequência (medida em Hertz). Quanto mais agudo (tom mais alto), maior o valor numérico em Hz.

Qualidade do áudio - Representação de frequência aguda e grave

Representação de frequência aguda e grave

Em geral, a frequência mais baixa que conseguimos ouvir – o som mais grave – é em torno de 20 Hz (ou 20 vinte oscilações de onda por segundo) e a mais alta – o som mais agudo –, em torno de 20 kHz (ou 20.000 oscilações por segundo).

Por questões técnicas (teorema de Nyquist), a mídia digital precisa comportar o dobro da capacidade da frequência que irá reproduzir. Assim, a taxa de amostragem de um CD (padrão da indústria por muito tempo) foi definida em 44.1 kHz.

Isso significa que com esse valor se tem dados suficientes (por segundo) para representar frequências de até 22 kHz, aproximadamente. Em teoria, mais do que o necessário para reproduzir qualquer som audível para nós, sendo que muita gente nem consegue perceber frequências tão agudas, principalmente com o avançar da idade – boa parte dos adultos não ouve frequências acima de 17 kHz ou mesmo 16 kHz.

Então, em 1995, chega ao mercado o DVD, e o padrão escolhido passa a ser 48 kHz. Novamente, o número foi definido por uma questão técnica: basicamente para arredondar valores em relação à quantidade de quadros por segundo (fps) em vídeo.

De acordo com o que vimos mais acima, fica claro que esse ligeiro aumento não altera nossa percepção do som reproduzido.

Apesar disso, alguns equipamentos permitem gravações em até 96 kHz ou mais. O único motivo para se trabalhar com valores tão elevados de sample rate é ter mais dados para manipular arquivos digitalmente (algo similar ao que vimos sobre trabalhar com WAV em relação ao MP3).

Porém, como isso implica em mais espaço de armazenamento e maior exigência de processamento, não é uma recomendação nossa. Para vídeo online ou podcast, as vantagens provavelmente serão insignificantes. Além do mais, em alguns casos, valores muito elevados de sample rate podem gerar distorções harmônicas indesejáveis.

Por isso, recomendamos utilizar 48 kHz, especialmente para se trabalhar com vídeo. Por ainda ser valor padrão de mercado, você terá menos riscos de incompatibilidades ou erros de leitura.

Alguns dos possíveis erros de compatibilidade têm relação com a duração do áudio e altura tonal (pitch) reproduzida. Por exemplo, um arquivo de 44.1 kHz pode soar mais rápido e “agudo” em um projeto configurado para 48 kHz. Já um arquivo 48 kHz, caso lido como 44.1 kHz, soará mais lento e com os timbres mais “graves”.

Qualidade do áudio - Áudios em 44.1 kHz e 48 kHz em uma mesma timeline

Áudios em 44.1 kHz e 48 kHz em uma mesma timeline

Por sorte, a maior parte dos softwares atuais consegue identificar essas diferenças de taxas de amostragem e já interpretam automaticamente o arquivo da maneira correta, realizando uma conversão instantânea (geralmente seguida de um aviso) quando o valor não bate com o definido no software.

Em alguns casos, para quem trabalha exclusivamente com áudio (principalmente música), pode ser um boa se manter em 44.1 kHz, pois apesar do CD estar em desuso, ainda é a principal mídia física para consumo musical.

Na realidade, dificilmente você vai ter problemas convertendo de um padrão para outro. Como dissemos, hoje em dia as plataformas e softwares leem e interpretam muito bem ambos os valores de taxas de amostragem.

Essas recomendações são apenas uma garantia para evitar possíveis e raros problemas, que podem gerar pequenos erros (artefatos digitais) decorrentes de falhas de conversões e afetar a qualidade de áudio.

Aplicando esse conhecimento no dia a dia: o que você deve considerar?

Falar sobre configurações de áudio, preferências e recomendações demanda algumas observações. Como o modo de consumo varia bastante, assim como a capacidade de audição das pessoas, o que pode ser uma ótima qualidade para alguns pode não ser para outros.

Além do mais, em uma cadeia de áudio existe uma infinidade de elementos que podem alterar o som de maneira bem mais significativa do que os tópicos mencionados aqui.

Para um aficcionado do áudio – alguém com ouvidos apurados, que utiliza excelentes equipamentos de alta fidelidade – diferenças de parâmetros (como taxas de compressão) podem ser mais perceptíveis, dependendo dos sons em questão.

Há ainda o fato de que alguns sons muito graves, apesar de não audíveis para nós – por exemplo, infrassons entre 4 e 16 Hz –, podem ser percebidos de maneira tátil.

Alguns estudos (controversos) também levam a crer que frequências ultrassônicas (acima de 20 kHz), em alguns casos podem ser percebidas pelo nosso organismo – não necessariamente por meio do sistema auditivo.

Por último, nossa audição não é tão desenvolvida quanto nossa visão. Por isso, fica bem mais difícil fazer avaliações de áudio. Assim, é comum o “efeito placebo” ao se analisar qualidade.

Pela mesma razão o mercado de eletrônicos pode, em alguns casos, se aproveitar da evolução técnica de equipamentos (maiores valores de bit depth, sample rate, resposta de frequências) para vender produtos que, na prática, podem não fazer diferença alguma para o usuário.

Agora que você já conhece algumas taxas importantes para garantir a qualidade de áudio, aproveite para ver  também nosso Hotmart tips sobre captação e tipos de microfones!

Nosso site utiliza cookies para melhorar sua experiência de navegação.