Jitter: teoria, analisi e misurazioni
Di tutti i parametri cruciali in un impianto audio, una naturale “fioritura” è forse il più importante - non è una fioritura artificiale che rapidamente diventa apparente e faticosa da ascoltare, ma una che è leggermente sottile e mai affaticante, che produce un suono realistico e con una 'presenza' reale. Il Jitter (e un upsampling errato) la distrugge.
Teoria del Jitter
È stato Julian Dunn che ha posto le basi per la comprensione del jitter in campo audio. Esempi del suo lavoro, che è molto interessante, si posssono facilmente trovare sul web. Nel contesto dell'audio digitale, il jitter si riferisce a errori di sincronizzazione del clock master utilizzato in DAC e ADC. Anche il minimo errore causa errori di ampiezza del segnale. L'effetto può essere modellato, simulato e misurato. È di tipo casuale, che è facile da capire, o deterministico, che lo è di meno.
Il jitter deterministico ha due forme: correlato ai dati e periodico. Come suggerisce il nome, il jitter correlato ai dati si verifica quando sono presenti certi modelli di dati. Il jitter periodico, d'altra parte, è ciclico - ha una frequenza definita. In un singolo periodo (1/F dove F=frequenza), i segnali del clock si allungano e si riducono anche se il tempo trascorso su un periodo di misura rimane stabile.
Jitter Casuale
Anche il jitter casuale, che incide sul SNR di un DAC, può essere modellato. Come ci si potrebbe aspettare, il jitter casuale deve essere basso per realizzare buone prestazioni di SNR. I miglioramenti sono difficili da realizzare in quanto sono necessarie riduzioni significative nel jitter prima che ci sia un cambiamento percepibile. Un altro parametro importante è la frequenza di campionamento (Fs). Più alto è il valore di Fs, maggiore è il SNR - raddoppiando il Fs si migliora il SNR di 3 dB. (Questo è stato dedotto dalla formula di Burr Brown per il calcolo del SNR di un DAC).
Jitter Periodico
Il jitter periodico ha, per definizione, una frequenza definita ed anche i suoi effetti di distorsione possono essere modellati. DAC (e ADC) creano distorsione (rumore di banda laterale) quando sono soggetti a jitter periodico. Per una data frequenza di ingresso, le bande laterali possono essere viste su entrambi i lati della fondamentale, distanziate dalla frequenza del jitter, come mostrato nella fig 1:
Figura 1. Jitter periodico (Jpp) di 7ns a 3kHz per un tono puro d'ingresso a 10 kHz. Ci sono bande laterali a 7 e 13 kHz la cui distanza dalla fondamentale è data dalla frequenza di jitter (qui, 3 kHz). Julian Dunn ha osservato che “In questa figura ci sono anche "gonne" per lo spettro vicino alla componente a 10 kHz. Queste sono a causa di qualche rumore jitter a bassa frequenza nel sistema.”
Mentre il grafico mostra jitter sinusoidale periodico che interessa un segnale audio a 10 kHz, il jitter da onda quadra è ancora più dannoso in quanto dà luogo a bande laterali continue su tutta la banda audio. Queste si possono determinare utilizzando la formula di Dunn:
Figura 2. I livelli di energia della banda laterale aumentano con frequenze più elevate e livelli di jitter audio superiore (J come in Jpp).
Nell'esempio, un Jpp a 7ns che agisce su di un tono di ingresso di 10 kHz offre bande laterali a -79.2db. La formula rispecchia come i livelli di energia di banda laterale aumentino all'aumentare delle frequenze e dei livelli di jitter. In termini semplici, significa che più alta è la frequenza di ingresso e maggiore è il jitter, maggiore è la forza (o energia) delle distorsioni sulla banda laterale.
Il jitter periodico è più dannoso di quello casuale in quanto le bande laterali non sono legate alle armoniche del tono riprodotto. Dal momento che le armoniche di ogni nota musicale si estendono anche verso le frequenze alte, il suono del decadimento di un segnale viene distorto dal jitter periodico: la sua 'fioritura' si perde. Il jitter è più dannoso alle alte frequenze, cioè quando si verificano grandi sbalzi di tensione (rotazione), ciò porta a errori di segnale di maggiore ampiezza.
Il Jitter è cumulativo
Tuttavia, per il jitter c'è di più oltre la modalità casuale e periodica. Altre forme, le quali influenzano la qualità audio (e hanno il potenziale di causare problemi di blocco di sincronizzazione), includono:
- jitter d'Interfaccia (errori di timing legati alla trasmissione – o perché cavi digitali suonano diversi);
- jitter correlato ai dati (di cui sopra);
- jitter intrinseco del chip ricevitore che decodifica i segnali in entrata.
Il punto critico è che il jitter è un fenomeno cumulativo: qualunque siano le sue fonti, si combinano in modo dannoso aumentando sempre i livelli di jitter totale. Globalmente, questo riguarda il clock di campionamento al DAC o ADC, che è dove si verifica la conversione del segnale e si attiva la distorsione. Il risultato è errori di ampiezza del segnale. Mentre DAC e ADC utilizzano segnali di clock diversi, è il jitter nel clock di campionamento (LRCK) che è più dannoso per le loro prestazioni. La Fig 2.b mostra il AK4358VQ della AKM (utilizzato sulla scheda audio Juli@).
Figura 2b. Pin layout del DAC chip di AKM. Offre otto canali di output (quattro coppie di L-R). L'input dei dati digitali (a livello bit) è sui pin da 13 a 16, i pin del clock sono 17 (LRCK), 10 (MCLK) e 9 (BICK). AKM chiama MCLK il Master Clock. È sincronizzato a LRCK (il più importante, spesso definito il word clock o di campionamento). AKM usa MCLK per operare il filtro d'interpolazione e il modulatore delta/sigma. (Ignorare i pin marchiati DSD.)
Figura 2c. Un diagramma temporale per il DAC chip di AKM (PCM in modalità default) che mostra LRCK (il clock di campionamento) dove un ciclo è 1/Fs (la frequenza di campionamento) e BICK (il bit-level clock, simile a un segnale SPDIF). Quando i dati sono "upsamplati" a 24/96, BICK funziona a 6.144 mHz.
Il clock di campionamento determina quando un campione (la coppia L-R) viene eseguito. Un errore temporale significa che i segnali sono processati fuori tempo per cui la loro ampiezza è sbagliata. Quella è la distorsione jitter.
Il jitter casuale è raro - è quasi sempre periodico. Questo è il peggior tipo di jitter ma i Phase Locked Loop (PLL) sono eccellenti nel rimuoverlo. Non importa quale sia la configurazione del sistema (integrato, Transport/DAC, ecc.), ci saranno PLL al lavoro. Purtroppo, però, possono funzionare solo sopra una soglia (cut-off) di frequenza definita, spesso 1 kHz. Non è possibile rimuovere il jitter al di sotto di questa soglia.
Si potrebbe argomentare che i progettisti debbano cercare di spostare l'energia del jitter a frequenze più elevate per permettere ai PLL di lavorare in modo più efficace se non fosse che il jitter ad alta frequenza ha alias e immagini proprio che appaiono al di sotto del cut-off.
Analisi del Jittter
Siccome il jitter è quasi sempre periodico, si può modellare per un tono in ingresso (onda sinusoidale pura). Il jitter periodico può essere raffigurato come un piccolo oscillatore 'all'attacco' del clock di campionamento del DAC, che cambia costantemente la sua precisione provocando errori di fase o di bordo, spostando la fase del clock nel tempo di una piccola quantità. Questo errore di jitter è dato da:
J(t) = 0.5 Jpp sin(Jf 2π t)
dove:
J è l'errore di jitter in secondi applicata alla fase del clock di campionamento,
t è il tempo per la fase del clock,
Jpp è l'ampiezza del jitter picco-picco
Jf è la frequenza del jitter.
In parole semplici, la formula dice che il jitter del clock di campionamento (errore di fase) è ciclico e, alla peggio, è la metà di Jpp (sottraendo o aggiungendo alla lunghezza della fase del clock). In un ciclo completo, il clock di campionamento mantiene la precisione in quanto vi sono fasi in cui gli intervalli di segnale del clock sono più lunghi e altri in cui sono più brevi. (Questa è la natura della funzione Sin) Per cui possono essere calcolati i seguenti parametri:
- L'errore di temporizzazione del clock, dati Jpp e Jf, per ogni periodo di campionamento (1/Fs);
- L'ampiezza del segnale di un campione (per qualsiasi Fs) per un dato input dell'onda sinusoidale;
- La distorsione jitter (o l'errata ampiezza del segnale). Al tempo del campione t, l'ampiezza del segnale è quella che avrebbe dovuto essere meno l'errore temporale: v'(t) = v(t - J(t)) dove v' è l'ampiezza del segnale distorto.
Dunn fornisce la formula per modellare la distorsione jitter per dati Jpp e Jf quando applicati ad un segnale di ingresso sinusoidale. Un programma è stato usato per generare file wav utilizzando tale formula e fornendo toni a 16 o 24-bit a qualsiasi frequenza di campionamento, sia puri che afflitti da jitter periodico (sono stati applicati un dithering di base e un noise shaping del 3° ordine).
Figura 3. Lo spettro di un tono 24/96 a 10 kHz generato dal programma con jitter modellato a 7 ns/3 kHz. Confronta questo con la figura 1 che rappresenta un vero tono a 10 kHz con lo stesso jitter. La previsione del modello è accurata, mostrando bande laterali separate di 6 kHz (a 7 e 13 kHz) a livelli simili. (L'asse della frequenza è logaritmica. Gli spettri in questo grafico sono stati catturati con l'analizzatore di spettro RMAA utilizzando una risoluzione FFT di 0,37 Hz).
Per cui, registrando le uscite analogiche di un DAC per un dato tono puro di input, si possono misurare le prestazioni di jitter totale: il livello e la posizione delle bande laterali forniscono misure precise di Jpp e Jf per la combinazione Transport/DAC (Jf si ottiene esaminando il risultato spettrale e Jpp viene calcolato in base al livello di banda laterale usando la formula 2).
Il metodo fornisce informazioni sulle prestazioni di jitter generale di una combinazione Transport/DAC, comprese le variabili difficili come l'efficacia del DAC nel respingere il jitter del segnale del Transport, la complessità del jitter d'interfaccia o l'effetto di utilizzare un Toslink in fibra di vetro, e ci riesce senza dover ricorrere a complesse tecniche di analisi del segnale di clock come eye-diagrams. Tre file di test sono stati generati con i risultati riportati di seguito.
Figura 4. File wav 24/96 generati via software sono stati utilizzati per misurare il jitter a frequenze di 7 kHz (a sinistra), 3 kHz (centro) e 14 kHz (a destra) con jitter simulato a 7 ns (3kHz). La prova di 14 kHz è stato progettata per dimostrare i tre toni (11, 14 e 17 kHz) che vengono ricreati in uscita dal DAC. Se questa eccessiva distorsione jitter fosse stato introdotta dal ADC, sarebbe visibile in uscita del DAC.
Misurazioni di Jitter
I test sono stati condotti per misurare la componente del jitter di un trasporto cMP collegato ad un DAC dCS Scarlatti. Il Transport, dotato di una scheda audio RME HDSP 9652, manda dati 24/96 attraverso una Toslink al DAC e fornisce il master clock (cioè il DAC è in slave).
Il segnale di uscita analogica è stato registrato con una seconda macchina cMP munita di scheda audio ESI Juli@ collegando l'uscita analogica del DAC tramite cavi Sommer Cable a bassa capacità (25 pF) agli ingressi bilanciati (TRS) della Juli@. Entrambe le macchine hanno i cavi di alimentazione di alta qualità, filtri di linea e attacchi indipendenti alla rete. Cubase LE software di registrazione è stato impostato per registrare stereo a 24/96.
Uscita dal DAC Scarlatti con un test tone a 7 kHz è mostrato in fig 5.
Figura 5. Test tone a 7 kHz registrato alle uscite del DAC (filtro 2).
Il rumore di fondo complessivo è a circa -140 dB con armoniche della fondamentale a 14, 21, 28 e 35 kHz. Per il test tone a 7kHz, bande laterali di jitter sono visibili esattamente a 2kHz dalla fondamentale e corrispondono ad un livello di -122db. Questo dá un Jf a 2kHz e un Jpp di soli ~72ps!
Riottimizzando il Recorder come da specifiche cMP, tranne Minlogon che non è possibile con Cubase, avendo cura di sospendere anche Svchost e Lsass, e ripetendo il test, abbiamo:
Figura 6. Rivela che le bande laterali di jitter a 2kHz non ci sono più! Componenti del jitter senza dubbio esistono, ma sono sepolte nel rumore di fondo.
Si dimostra, inoltre, che una riduzione del 'peso' del runtime del Sistema Operativo ha un effetto diretto sulla quantità di jitter misurata. Il rumore sulle bande laterali del jitter aumenta con l'aumentare della frequenza, per cui un tono a 14 kHz dovrebbe rivelare più jitter.
Figura 7. Le componenti a 2 kHz sono bassissime a -135.5db, producendo un Jpp di soli 11 ps ma i livelli di jitter più alti sono visibili in primo piano.
Figura 8. I livelli di jitter sono visibili guardando alla fig.8 in primo piano.
Un singolo componente della banda laterale jitter di oltre -130dB si tradurrebbe in più di 20 ps Jpp. Nessun componente del genere è visibile nel grafico sopra, ma i singoli componenti del jitter si possono individuare nelle figure 7 e 8 (tono di ingresso a 14kHz) come segue:
- A 2 kHz, un livello di -135.5db (Jpp = 11 ps)
- A 1.605 kHz, un livello di -132,0 dB (Jpp = 16 ps)
- A 5.904 kHz, un livello di -134,0 dB (Jpp = 13 ps)
- Il rumore tipo Jitter vicino alla fondamentale (da 600 a 800 Hz, solo canale RH) con picco di -131,5 dB (Jpp = 17 ps). I valori reali sono -131,5 dB (17 ps), -133,0 dB (14 ps), -134,7 dB (12 ps), -131,8 dB (16 ps) e -133,5 dB (14 ps x 6).
Complessivamente questo produce un Jpp di 51 ps!
Conclusione
Anche se un ascolto prolungato aveva fatto intuire che cMP produceva un basso jitter, non si immaginava mai che si sarebbero raggiunti valori così bassi di Jpp di appena 51 ps. Ad esempio, le recensioni su Stereophile di apparecchiature raramente scendono a livelli di jitter inferiori a 200 ps, e comunque sono ben al di sopra 100 ps.
I risultati spiegano perché il clock Scarlatti non è riuscito a impressionare: la complessità aggiunta dal dispositivo tramite un ulteriore alimentatore e circuiti di sincronizzazione del clock e il fatto che il circuito non era più isolato galvanicamente, assieme hanno iniettato del rumore che è arrivato al clock di campionamento del DAC – una misurazione del jitter con il clock in funzione mostra un aumento di 4 ps in Jpp. Ciò detto, il DAC Scarlatti sicuramente fa la sua figura in questo contesto.
Forse la deduzione più interessante ottenuta dal ciclo di misura è che i problemi di jitter non sono necessariamente risolti con una 'pulizia' del clock di campionamento. Quello sarebbe curare il sintomo, non la causa. Non c'è dubbio che il clock Scarlatti offra alta precisione e basso jitter, ma oscillatori a cristalli (XOs) già offrono una stabilità eccezionale e, cosa più importante, un basso jitter di 20 ps. Sono le componenti inquinanti come il rumore di alimentazione che li destabilizza e danno luogo a scarse prestazioni.
Un Transport basato su CD rotanti inevitabilmente destabilizza il clock. In tale contesto, il trattamento del clock come auspicato da dCS può avere un ruolo utile. Questo non vale per i Computer Audio Transport.
Mentre le problematiche relative alla qualità dell'alimentazione sono ben comprese e sono stati fatti significativi passi in avanti a riguardo, c'è altro da considerare. La Figura 2b (vedi sopra), ad esempio, mostra un tipico DAC chip. Un clock di campionamento apparentemente perfetto che entra nel chip dopo un trattamento completo è ancora soggetto a rumore da parte degli input del chip stesso. A livello microscopico, i DAC sono complessi circuiti integrati il cui clock di campionamento non è isolato galvanicamente. Rumore dai dati e da altri pin del clock creano facilmente un impatto sul clock di campionamento. Con i DAC che diventano sempre più complessi e con livelli sempre più elevati di sample buffering, questo tipo di contaminazione sembra destinata a crescere. In altre parole, ogni pin ha bisogno di essere “pulito”.
In un Computer Audio Transport, le impostazioni dei parametri di RAM, la qualità della RAM e il traffico su scheda madre, creano tutti una differenza percepibile. La purezza con cui i dati vengono trasmessi al DAC è essenziale. È qui che cMP eccelle – e ciò è misurabile.