Il grande mito audio: perché non hai bisogno di quel DAC a 32 bit

Autore: Randy Alexander
Data Della Creazione: 1 Aprile 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Il grande mito audio: perché non hai bisogno di quel DAC a 32 bit - Tecnologie
Il grande mito audio: perché non hai bisogno di quel DAC a 32 bit - Tecnologie

Contenuto


Come probabilmente avrai notato, c'è una nuova tendenza nel settore degli smartphone che include chip audio di "qualità da studio" all'interno dei moderni smartphone di punta. Mentre un DAC a 32 bit (convertitore da digitale ad analogico) con supporto audio a 192 kHz sembra sicuramente buono sul foglio delle specifiche, semplicemente non c'è alcun vantaggio nel far salire le dimensioni delle nostre raccolte audio.

Sono qui per spiegare perché questa profondità di bit e la frequenza di campionamento sono solo un altro esempio del settore audio che sfrutta la mancanza di conoscenza dei consumatori e persino audiofili sull'argomento. Indossa i tuoi berretti da secchione, entreremo in alcuni punti seriamente tecnici per spiegare i dettagli dell'audio professionale. E spero che ti dimostrerò anche perché dovresti ignorare la maggior parte dell'hype di marketing.

Lo senti?

Prima di approfondire, questo primo segmento offre alcune informazioni di base necessarie sui due concetti principali di audio digitale, profondità di bit e frequenza di campionamento.


La frequenza di campionamento si riferisce alla frequenza con cui acquisiremo o riprodurremo informazioni sull'ampiezza di un segnale. In sostanza, tagliamo una forma d'onda in molte piccole parti per saperne di più in un determinato momento. Il teorema di Nyquist afferma che la frequenza più alta possibile che può essere catturata o riprodotta è esattamente la metà di quella della frequenza di campionamento. Questo è abbastanza semplice da immaginare, poiché abbiamo bisogno delle ampiezze per la parte superiore e inferiore della forma d'onda (che richiederebbe due campioni) per conoscere con precisione la sua frequenza.

Aumentando la frequenza di campionamento (in alto) si ottengono ulteriori campioni al secondo, mentre una profondità in bit maggiore (in basso) fornisce più valori possibili per la registrazione del campione.


Per quanto riguarda l'audio, ci occupiamo solo di ciò che possiamo ascoltare e della stragrande maggioranza delle persone che ascoltano la coda appena prima di 20 kHz. Ora che conosciamo il teorema di Nyquist, possiamo capire perché 44.1kHz e 48kHz sono frequenze di campionamento comuni, poiché sono poco più del doppio della frequenza massima che possiamo sentire. L'adozione di standard di qualità da studio a 96kHz e 192kHz non ha nulla a che fare con l'acquisizione di dati a frequenza più elevata, sarebbe inutile. Ma ci approfondiremo di più tra un minuto.

Mentre osserviamo le ampiezze nel tempo, la profondità in bit si riferisce semplicemente alla risoluzione o al numero di punti disponibili al fine di memorizzare questi dati di ampiezza. Ad esempio, 8 bit ci offre 256 punti diversi da arrotondare, risultati a 16 bit in 65.534 punti e dati a 32 bit che ci forniscono 4.294.967.294 punti dati. Anche se ovviamente, questo aumenta notevolmente le dimensioni di qualsiasi file.

Potrebbe essere facile pensare immediatamente alla profondità di bit in termini di accuratezza dell'ampiezza, ma i concetti più importanti da comprendere qui sono quello del rumore e della distorsione. Con una risoluzione molto bassa, probabilmente perderemo blocchi di informazioni di ampiezza inferiore o taglieremo le cime delle forme d'onda, introducendo inesattezze e distorsioni (errori di quantizzazione). È interessante notare che questo suonerà spesso come rumore se si dovesse riprodurre un file a bassa risoluzione, perché abbiamo effettivamente aumentato la dimensione del segnale più piccolo possibile che può essere catturato e riprodotto. Questo è esattamente lo stesso dell'aggiunta di una fonte di rumore alla nostra forma d'onda. In altre parole, abbassando la profondità di bit si riduce anche il rumore di fondo. Potrebbe anche aiutare a pensare a questo in termini di un campione binario, in cui il bit meno significativo rappresenta il rumore di fondo.

Pertanto, una profondità di bit più elevata ci dà un rumore di fondo maggiore, ma esiste un limite finito a quanto questo sia pratico nel mondo reale. Sfortunatamente, c'è rumore di sottofondo ovunque, e non intendo l'autobus che passa per strada. Dai cavi alle cuffie, i transistor in un amplificatore e persino le orecchie all'interno della testa, il rapporto segnale-rumore massimo nel mondo reale è di circa 124 dB, che raggiunge circa 21 bit di dati.Jargon Buster:

DAC- Un convertitore da digitale ad analogico prende i dati audio digitali e li trasforma in un segnale analogico da inviare a cuffie o altoparlanti.

Frequenza di campionamento- Misurato in Hertz (Hz), questo è il numero di campioni di dati digitali acquisiti ogni secondo.

SNR- Il rapporto segnale-rumore è la differenza tra il segnale desiderato e il rumore di fondo del sistema. In un sistema digitale questo è direttamente collegato alla profondità di bit.

Per fare un confronto, 16 bit di acquisizione offrono un rapporto segnale / rumore (la differenza tra segnale e rumore di fondo) di 96,33 dB, mentre 24 bit offre 144,49 dB, che supera i limiti di acquisizione hardware e percezione umana. Quindi il DAC a 32 bit sarà effettivamente in grado di emettere al massimo 21 bit di dati utili e gli altri bit saranno mascherati dal rumore del circuito. In realtà, tuttavia, le apparecchiature più economiche costano un SNR compreso tra 100 e 110 dB, poiché la maggior parte degli altri elementi del circuito introdurrà il proprio rumore. Chiaramente, quindi, i file a 32 bit sembrano già piuttosto ridondanti.

Ora che abbiamo compreso le basi dell'audio digitale, passiamo ad alcuni dei punti più tecnici.

Scalinata verso il cielo

La maggior parte dei problemi relativi alla comprensione e al malinteso dell'audio è legato al modo in cui le risorse educative e le aziende tentano di spiegare i benefici utilizzando segnali visivi. Probabilmente avete visto tutti l'audio rappresentato come una serie di gradini per linee di profondità bit e rettangolari per la frequenza di campionamento. Questo non sembra certo molto buono se lo paragoni a una forma d'onda analogica dall'aspetto uniforme, quindi è facile tracciare scale "più lisce" dall'aspetto più fine per rappresentare una forma d'onda di uscita più accurata.

Anche se potrebbe essere una vendita facile per il pubblico, questa comune analogia di precisione "scale" è un'enorme direzione errata e non riesce a capire come funziona realmente l'audio digitale. Ignoralo.

Tuttavia, questa rappresentazione visiva travisa come funziona l'audio. Sebbene possa sembrare disordinato, matematicamente i dati al di sotto della frequenza di Nyquist, ovvero la metà della frequenza di campionamento, sono stati acquisiti perfettamente e possono essere riprodotti perfettamente. Immagina questo, anche alla frequenza di Nyquist, che spesso può essere rappresentata come un'onda quadra anziché come un'onda sinusoidale liscia, abbiamo dati accurati per l'ampiezza in un determinato momento, che è tutto ciò di cui abbiamo bisogno. Noi umani spesso guardiamo erroneamente lo spazio tra i campioni, ma un sistema digitale non funziona allo stesso modo.

La profondità di bit è spesso legata alla precisione, ma in realtà definisce le prestazioni del rumore del sistema. In altre parole, il più piccolo segnale rilevabile o riproducibile.

Quando si tratta di riproduzione, questo può diventare un po 'più complicato, a causa del concetto di DAC di "ordine zero" di facile comprensione, che passerà semplicemente da un valore all'altro a una frequenza di campionamento impostata, producendo un risultato a gradini. Questa non è in realtà una rappresentazione equa di come funzionano i DAC audio, ma mentre siamo qui possiamo usare questo esempio per dimostrare che non dovresti preoccuparti di quelle scale comunque.

Un fatto importante da notare è che tutte le forme d'onda possono essere espresse come la somma di più onde sinusoidali, una frequenza fondamentale e componenti aggiuntivi a multipli armonici. Un'onda triangolare (o un gradino della scala) è costituita da armoniche dispari ad ampiezze decrescenti. Quindi, se ci sono molti piccoli passi che si verificano alla nostra frequenza di campionamento, possiamo dire che ci sono alcuni contenuti armonici extra aggiunti, ma si verificano al doppio della nostra frequenza udibile (Nyquist) e probabilmente alcune armoniche oltre a ciò, quindi abbiamo vinto riuscirai comunque a sentirli. Inoltre, sarebbe abbastanza semplice filtrare utilizzando alcuni componenti.

Se separiamo i campioni DAC, possiamo facilmente vedere che il nostro segnale desiderato è rappresentato perfettamente insieme a una forma d'onda aggiuntiva alla frequenza di campionamento DAC.

Se questo è vero, dovremmo essere in grado di osservarlo con un rapido esperimento. Prendiamo un'uscita direttamente da un DAC di mantenimento di ordine zero di base e inviamo anche il segnale attraverso un 2 molto sempliceND ordina il filtro passa basso impostato a metà della nostra frequenza di campionamento. In realtà ho usato solo un segnale a 6 bit qui, solo per poter effettivamente vedere l'uscita su un oscilloscopio. Un file audio a 16 o 24 bit avrebbe molto meno rumore sul segnale sia prima che dopo il filtraggio.

Un esempio piuttosto grezzo, ma ciò dimostra che i dati audio vengono ricreati perfettamente all'interno di questa scala dall'aspetto disordinato.

E come per incanto, il gradino delle scale è quasi completamente scomparso e l'output è "smussato", semplicemente usando un filtro passa-basso che non interferisce con la nostra uscita sinusoidale. In realtà, tutto ciò che abbiamo fatto è stato filtrare parti del segnale che non avresti sentito comunque. Questo non è davvero un brutto risultato per altri quattro componenti che sono sostanzialmente liberi (due condensatori e due resistori costano meno di 5 pence), ma in realtà ci sono tecniche più sofisticate che possiamo usare per ridurre ulteriormente questo rumore. Meglio ancora, questi sono inclusi come standard nella maggior parte dei DAC di buona qualità.

Trattare con un esempio più realistico, qualsiasi DAC da utilizzare con l'audio presenterà anche un filtro di interpolazione, noto anche come up-sampling. L'interpolazione è semplicemente un modo per calcolare punti intermedi tra due campioni, quindi il DAC sta facendo molto di questo "smoothing" da solo, e molto più che raddoppiare o quadruplicare la frequenza di campionamento. Meglio ancora, non occupa spazio aggiuntivo per i file.

I filtri di interpolazione che si trovano comunemente in qualsiasi DAC degno di nota sono una soluzione molto migliore rispetto al trasporto di file con frequenze di campionamento più elevate.

I metodi per farlo possono essere piuttosto complessi, ma essenzialmente il tuo DAC sta cambiando il suo valore di output molto più spesso di quanto suggerisca la frequenza di campionamento del tuo file audio. Ciò spinge le armoniche impercettibili dei gradini della scala molto al di fuori della frequenza di campionamento, consentendo l'uso di filtri più lenti, più facilmente raggiungibili che hanno meno ondulazioni, preservando quindi i bit che vogliamo davvero sentire.

Se sei curioso di sapere perché vogliamo rimuovere questo contenuto che non riusciamo a sentire, la semplice ragione è che la riproduzione di questi dati extra lungo la catena del segnale, diciamo in un amplificatore, sprecherebbe energia. Inoltre, a seconda di altri componenti del sistema, questo contenuto "ultra-sonico" a frequenza più elevata potrebbe effettivamente portare a maggiori quantità di distorsione di intermodulazione in componenti a larghezza di banda limitata. Pertanto, il tuo file a 192 kHz probabilmente causerebbe più danni che benefici, se effettivamente ci fosse del contenuto ultra-sonoro all'interno di quei file.

Se fossero necessarie ulteriori prove, mostrerò anche un output da un DAC di alta qualità utilizzando il Circus Logic CS4272 (nella foto in alto). CS4272 presenta una sezione di interpolazione e un filtro di uscita integrato ripido. Tutto ciò che stiamo facendo per questo test è usare un microcontrollore per alimentare il DAC con due campioni a 16 bit alti e bassi a 48kHz, dandoci la massima forma d'onda di uscita possibile a 24kHz. Non ci sono altri componenti di filtraggio utilizzati, questa uscita proviene direttamente dal DAC.

Il segnale di uscita a 24 kHz (in alto) da questo componente DAC da studio non sembra certo la forma d'onda rettangolare associata al normale materiale di marketing. La frequenza di campionamento (Fs) viene visualizzata nella parte inferiore dell'oscilloscopio.

Notare come l'onda sinusoidale di uscita (in alto) sia esattamente la metà della velocità del clock di frequenza (in basso). Non ci sono gradini di scala evidenti e questa forma d'onda ad altissima frequenza sembra quasi un'onda sinusoidale perfetta, non un'onda quadra dall'aspetto a blocchi che il materiale di marketing o anche uno sguardo casuale ai dati di output suggerirebbero. Ciò dimostra che anche con solo due campioni, la teoria di Nyquist funziona perfettamente nella pratica e possiamo ricreare un'onda sinusoidale pura, assente di qualsiasi contenuto armonico aggiuntivo, senza un'enorme profondità di bit o frequenza di campionamento.

La verità su 32-bit e 192 kHz

Come per la maggior parte delle cose, c'è un po 'di verità nascosta dietro tutto il gergo e l'audio a 32 bit, 192 kHz è qualcosa che ha un uso pratico, non solo nel palmo della tua mano. Questi attributi digitali sono effettivamente utili quando ci si trova in un ambiente di studio, quindi le affermazioni di portare "audio di qualità da studio su cellulare", ma queste regole semplicemente non si applicano quando si desidera mettere la traccia finita in tasca.

Prima di tutto, iniziamo con la frequenza di campionamento. Un vantaggio spesso propagandato dell'audio a risoluzione più elevata è la conservazione di dati ultra-sonori che non è possibile ascoltare ma influiscono sulla musica. Spazzatura, la maggior parte degli strumenti cade molto prima dei limiti di frequenza del nostro udito, il microfono utilizzato per catturare uno spazio rotabile al massimo a circa 20 kHz e le cuffie che stai usando certamente non si estenderanno così tanto. Anche se potessero, le tue orecchie semplicemente non riescono a rilevarlo.

La sensibilità tipica dell'udito umano raggiunge i 3kHz e inizia rapidamente a decollare dopo 16kHz.

Tuttavia, il campionamento a 192 kHz è abbastanza utile per ridurre il rumore (quella parola chiave ancora una volta) durante il campionamento dei dati, consente una costruzione più semplice di filtri di input essenziali ed è anche importante per l'effetto digitale ad alta velocità. Il sovracampionamento al di sopra dello spettro udibile ci consente di calcolare la media del segnale per ridurre il rumore di fondo. Scoprirai che la maggior parte dei buoni ADC (convertitori da analogico a digitale) oggigiorno vengono forniti con over-sampling a 64 bit o più.

Ogni ADC deve anche rimuovere le frequenze al di sopra del limite di Nyquist, altrimenti finirai con un pessimo aliasing dal suono quando le frequenze più alte vengono "ripiegate" nello spettro udibile. Avere un divario maggiore tra la nostra frequenza d'angolo del filtro da 20 kHz e la frequenza di campionamento massima è più accomodante per i filtri del mondo reale che semplicemente non possono essere così ripidi e stabili come i filtri teorici richiesti. Lo stesso vale alla fine del DAC, ma come abbiamo discusso dell'intermodulazione può spingere molto efficacemente questo rumore fino a frequenze più alte per un filtraggio più semplice.

Più ripido è il filtro, maggiore è l'ondulazione nella banda passante. L'aumento della frequenza di campionamento consente l'uso di filtri "più lenti", che aiutano a preservare una risposta in frequenza piatta nella banda passante udibile.

Nel dominio digitale, regole simili si applicano per i filtri che vengono spesso utilizzati nel processo di missaggio in studio. Frequenze di campionamento più elevate consentono filtri più ripidi e ad azione più rapida che richiedono dati aggiuntivi per funzionare correttamente. Nulla di tutto ciò è necessario quando si tratta di riproduzione e DAC, poiché siamo interessanti solo per ciò che si può effettivamente ascoltare.

Passando a 32 bit, chiunque abbia mai tentato di codificare una matematica a distanza complessa comprenderà l'importanza della profondità di bit, sia con dati interi che in virgola mobile. Come abbiamo discusso, più bit si riduce il rumore e questo diventa più importante quando iniziamo a dividere o sottrarre segnali nel dominio digitale a causa di errori di arrotondamento ed evitare errori di clipping durante la moltiplicazione o l'aggiunta.

La profondità di bit aggiuntiva è importante per preservare l'integrità di un segnale quando si eseguono operazioni matematiche, come all'interno del software audio da studio. Ma possiamo eliminare questi dati extra al termine del mastering.

Ecco un esempio, diciamo che prendiamo un campione a 4 bit e il nostro campione attuale è 13, che è 1101 in binario. Ora prova a dividerlo per quattro e rimaniamo con 0011, o semplicemente 3. Abbiamo perso lo 0,25 in più e questo rappresenterà un errore se tentassimo di fare matematica aggiuntiva o riportare il nostro segnale in una forma d'onda analogica.

Questi errori di arrotondamento si manifestano come quantità molto ridotte di distorsione o rumore, che possono accumularsi su un gran numero di funzioni matematiche. Tuttavia, se estendiamo questo campione a 4 bit con ulteriori bit di informazioni da utilizzare come fazione o punto decimale, possiamo continuare a dividere, aggiungere e moltiplicare per molto più tempo grazie ai punti dati extra. Quindi, nel mondo reale, il campionamento a 16 o 24 bit e quindi la conversione di questi dati in un formato a 32 bit per l'elaborazione di nuovo aiuta a risparmiare rumore e distorsione. Come abbiamo già detto, a 32 bit è un sacco di punti di precisione.

Ora, ciò che è altrettanto importante riconoscere è che non abbiamo bisogno di questo margine aggiuntivo quando torniamo nel dominio analogico. Come abbiamo già discusso, circa 20 bit di dati (-120 dB di rumore) il massimo assoluto che è possibile rilevare, quindi possiamo riconvertire in una dimensione di file più ragionevole senza influire sulla qualità audio, nonostante il fatto che gli "audiofili" siano probabilmente lamentando questi dati persi.

Tuttavia, introdurremo inevitabilmente alcuni errori di arrotondamento quando ci spostiamo a una profondità di bit inferiore, quindi ci sarà sempre una piccola quantità di distorsione extra poiché questi errori non si verificano sempre in modo casuale. Sebbene questo non sia un problema con l'audio a 24 bit in quanto si estende ben oltre il rumore di fondo analogico, una tecnica chiamata "dithering" risolve perfettamente questo problema per i file a 16 bit.

Un esempio di confronto della distorsione introdotta dal troncamento e dal dithering.

Questo viene fatto randomizzando il bit meno significativo del campione audio, eliminando gli errori di distorsione ma introducendo un rumore di fondo casuale molto silenzioso che si diffonde tra le frequenze. Sebbene l'introduzione del rumore possa sembrare contro intuitiva, ciò riduce effettivamente la quantità di distorsione udibile a causa della casualità. Inoltre, utilizzando speciali schemi di dithering a forma di rumore che abusano della risposta in frequenza dell'orecchio umano, l'audio con dithering a 16 bit può effettivamente mantenere un livello di rumore percepito molto vicino a 120 dB, proprio ai limiti della nostra percezione.

I dati a 32 bit e le frequenze di campionamento di 192 kHz hanno notevoli vantaggi in studio, ma le stesse regole non si applicano alla riproduzione.

In poche parole, lascia che gli studi ostruiscano i loro dischi rigidi con questo contenuto ad alta risoluzione, semplicemente non abbiamo bisogno di tutti quei dati superflui quando si tratta di riproduzione di alta qualità.

Incartare

Se sei ancora con me, non considerare questo articolo come un completo rifiuto degli sforzi per migliorare i componenti audio dello smartphone. Sebbene la propagazione del numero possa essere inutile, componenti di qualità superiore e una migliore progettazione dei circuiti rappresentano ancora un eccellente sviluppo nel mercato mobile, dobbiamo solo assicurarci che i produttori focalizzino la loro attenzione sulle cose giuste. Il DAC a 32 bit nell'LG V10, ad esempio, sembra fantastico, ma non è necessario preoccuparsi di enormi dimensioni di file audio per sfruttarlo.

La capacità di pilotare cuffie a bassa impedenza, preservare un pavimento a basso rumore dal DAC al jack e offrire una distorsione minima sono caratteristiche molto più importanti per l'audio dello smartphone rispetto alla profondità di bit o alla frequenza di campionamento supportate teoricamente, e speriamo di riuscire per approfondire questi punti in modo più dettagliato in futuro.

Il amung Galaxy 10 Plu è dotato di varie capacità di archiviazione: 128 GB, 512 GB e 1 TB. Le varianti da 128 GB e 512 GB hanno 8 GB di RAM, ma la variante da 1 TB è unica e offre 12 GB...

amung Galaxy 10 e Galaxy 10 Plu non includono un modello RAM da 6 GB, amung ha confermato (tramite Polizia Android). Nonotante varie affermazioni della tea amung, le ultime informazioni uggericono che...

Nuove Pubblicazioni