ARLA/CLUSTER: Taxa de amostragem e taxa de transferência de bits (ou bit rate).
João Costa > CT1FBF
ct1fbf gmail.com
Sexta-Feira, 14 de Setembro de 2012 - 16:48:09 WEST
Taxa de amostragem e taxa de quantização (ou taxa de transferência de
bits - bit rate em inglês), são dois parâmetros encontrados
frequentemente tanto em softwares de áudio quanto em configurações de
interfaces de áudio. Eles estão relacionados à conversão de um sinal
analógico (o sinal que está sendo gravado) para um sinal digital a ser
processado pelo computador. Esta conversão é feita pelos chamados
conversores analógico-digitais (ou conversores AD/DA). Tomando como
exemplo uma gravação do som de uma guitarra feita em linha, o sinal
analógico gerado pelos captadores (microfones) da guitarra é
convertido num "sinal" digital dentro da interface de áudio, e é este
sinal digital que é processado pelo computador.
Para facilitar a compreensão, pense no sinal como o gráfico da
variação da tensão eléctrica gerada pelos captadores (microfones) da
guitarra em função do tempo. Para que seja possível o processamento do
sinal, é necessário que seja criada uma "tabela" de valores de tensão
eléctrica a cada instante de tempo para que o computador possa fazer
as contas relativas ao processamento. Como o sinal de entrada é uma
função contínua (ou seja, o gráfico é uma linha contínua, não tem
"buracos"), ele possui muita informação, de modo que é necessário
criar a "tabela" de alguns valores de tensão em determinados instantes
de tempo. Este processo de leitura dos valores de tensão a cada
intervalo de tempo é chamado amostragem. Este intervalo de tempo é
chamado período de amostragem (Ta). A frequência de amostragem (Fa) é
o inverso do período de amostragem ou seja: Fa = 1/Ta, com Fa em Hz e
Ta em segundos.
Tomando como exemplo a interface de áudio M-Audio Fast Track USB, ela
tem uma frequência de amostragem de 48kHz (ou 48000Hz). Isso significa
que o período de amostragem dela é de aproximadamente 0,000021s (ou
210 microssegundos). Ou seja, a cada 210 microssegundos, o conversor
analógico-digital (ou conversor AD) lê a tensão eléctrica e armazena
este valor no instante de tempo respectivo. O computador usa esta
tabela de valores de tensão a cada instante de tempo para fazer os
processos que você quiser: aumentar/diminuir o volume, comprimir,
colocar delay, reverb, modulações, etc. Quando você quiser escutar o
som, o computador reconstrói o sinal original a partir da tabela de
valores de tensão a cada instante de tempo e o que você escuta é o
sinal reconstruído. A grosso modo, esta reconstrução é feita criando
uma "escadinha" a partir dos pontos de tensão ao longo do tempo
plotados (sondados) num gráfico. Este método de reconstrução de sinal
gera um sinal reconstruído com menor intensidade na frequência
fundamental e com algumas outras frequências que não haviam no sinal
original.
Pode parecer tudo perfeito na teoria, mas há um grande problema: qual
é a frequência de amostragem ideal? É razoável concluir que, quanto
maior for a taxa de amostragem, melhor será a fidelidade do sinal
reconstruído em relação ao sinal original, porém há uma restrição para
o valor máximo da taxa de amostragem, já que quanto maior ela for,
mais poderoso deve ser o computador ou o processador da interface de
áudio.
Agora vamos pensar no sinal como tendo uma forma sinusoidal. Da figura
(imagine que o gráfico mostra tensão no eixo vertical e tempo no eixo
horizontal), podemos concluir que o período do sinal (Ts) é de 2 pi
segundos (aproximadamente 6,28s). Se adoptássemos um período de
amostragem de 7s, por exemplo, pode-se concluir que o sinal amostrado
será ruim, pois não dá para se construir uma sinusóide a partir dos
pontos amostrados (isso pode ser provado matematicamente). Se
adoptássemos um período de amostragem exactamente igual ao período do
sinal, o sinal amostrado seria constante, pois todos os pontos
amostrados estariam na mesma tensão. Se adoptássemos um período de
amostragem igual à metade do período do sinal (aproximadamente 3,14s),
ainda haveria o risco de o sinal amostrado ser ruim, pois poderíamos
amostrar justamente os pontos onde a tensão é zero, e assim obteríamos
um sinal amostrado constante igual a zero. Portanto para ter um sinal
bem amostrado, deve-se adoptar um período de amostragem menor que o
dobro do período do sinal. Como a frequência de amostragem é o inverso
do período de amostragem, tira-se a seguinte conclusão:
Para ter-se um bom sinal amostrado, deve-se utilizar uma frequência de
amostragem maior que o dobro da frequência do sinal.
Esta conclusão é chamada de Teorema de Amostragem de Nyquist. A partir
dela podemos tirar importantes conclusões. Uma conclusão importante é
a explicação de porque se devem realizar gravações com taxas de
amostragem por volta de 40kHz. Lembrando que o ouvido humano pode
escutar frequências de até 20kHz, deve-se utilizar uma frequência de
amostragem de aproximadamente 40kHz para garantir que o som seja bem
amostrado.
O raciocínio da amostragem é o mesmo utilizado para a quantização.
Enquanto a amostragem é uma discretização ("divisão") da escala de
tempo, a quantização (ou bit rate, do inglês) é a discretização feita
na escala de tensão do sinal. Intervalo de quantização é o intervalo
de tensão que corresponde a um número binário de n bits (n zeros ou
uns), ou seja, é igual à faixa de valores de tensão que o conversor AD
pode ler dividido por 2 elevado a n. Taxa de quantização é o número de
bits, trocando em miúdos.
A quantização é feita pelos mesmos motivos da amostragem, só que no
caso da quantização a unidade é o bit. Ou seja, uma interface cuja
taxa de quantização é de 24 bits (que é o caso da M-Audio Fast Track)
divide a escala de tensão do sinal em 2 elevado a 24 partes (16777216
partes). Da mesma forma que na amostragem, o conversor AD lê o sinal
de tensão e, segundo sua faixa de valor, o converte para um número
binário. O sinal amostrado tem a aparecia de uma "escadinha" que desce
e sobe conforme o sinal original, cujos degraus têm a altura
equivalente ao intervalo de quantização e largura equivalente ao
período de amostragem. Logicamente, quanto maior for a taxa de
quantização, o sinal amostrado será mais próximo do sinal original. A
limitação para a taxa de quantização também é dada no processamento
computacional.
Bom, todo este texto foi para concluir o seguinte:
Bons equipamentos de áudio têm taxa de amostragem superior a 40kHz.
Taxas de amostragem inferiores a esta podem gerar sinais de má
qualidade.
Fonte: Erico Ascenção no Fórum Crifa Club
Mais informações acerca da lista CLUSTER