HQPlayer e i filtri
Prima qualche spiegazione a proposito di dominio del tempo e della frequenza - mi scuso per l'uso talvolta di gergo tecnico.
La frequenza è il cambiamento del segnale in funzione del tempo. Quindi un segnale si presenta sia in frequenza che nel tempo.
Un filtro "a fase lineare" è un filtro in cui tutte le frequenze passano con il medesimo ritardo.
Un filtro "a fase minima" è un filtro in cui tutte le frequenze passano attraverso il più velocemente possibile, le frequenze superiori più velocemente di quelli inferiori.
I filtri più lunghi/ripidi cambiano più velocemente dal passare le frequenze al non passarle in funzione della frequenza.
I filtri più corti/dolci applicano più lentamente o "dolcemente" questa transizione di stato in funzione della frequenza.
Più il filtro vuole rilevare accuratamente le frequenze e fare la transizione di passaggio/stop più velocemente, più il filtro avrà bisogno di tempo per "guardare" il segnale. Questo ha un effetto collaterale chiamato "ringing" o meglio " blur temporale". D'altra parte, un filtro troppo corto che guarda solo ad un singolo momento non può filtrare nulla, perché vede solo un singolo punto di tempo alla volta, senza alcuna conoscenza del prima e del dopo (quindi non è in grado di rilevare eventuali frequenze dato che queste cambiano in funzione del tempo). Durante il calcolo un filtro a fase lineare prende in considerazione un'uguale quantità di prima e dopo. Il problema in tutto ciò è che è abbastanza innaturale che qualcosa che sta per accadere dopo possa influenzare già il presente. Un filtro a fase minima, invece, considera solo dal presente al prima, in modo che non si abbiano ripercussioni su ciò che avviene dopo. Questo "ringing" sta già nella maggior parte delle registrazioni Redbook, dato che spesso l'ADC ha subìto una down-conversion e, eventualmente, un altro passaggio nella masterizzazione da 24/96 o simili a RedBook. Un filtro "apodizing" sostituisce o modifica il "ringing" originale con il proprio - che può essere inferiore a quello originale. Tutti i filtri illustrati di seguito sono più o meno "apodizing" se non diversamente specificato.
Perché è necessario il filtraggio?
Perché altrimenti l'upsampling/oversampling produce componenti alias (distorsione) a frequenze superiori a quella originale. Nella down-conversion è ancora peggio, perché tali componenti sono prodotti sotto quelli originali. La conversione D-A produce anche questi componenti sopra la metà della frequenza di campionamento, e quelli vengono quindi rimossi dai filtri di ricostruzione analogici. Maggiore è la frequenza di campionamento vista dalla stadio di conversione D-A, più semplice potrà essere il conseguente filtro analogico. I filtri digitali possono facilmente superare in prestazioni quelli analogici. L'eliminazione di queste frequenze spurie attraverso il filtraggio si chiama "ricostruzione" del segnale.
In generale, la scelta del modulatore dipende principalmente dal DAC impiegato, mentre la scelta del filtro dipende più dalle proprie preferenze ed aree su cui ci si focalizza.
Esaminiamo l'offerta di filtri di HQPlayer:
Poi alla voce successiva troviamo dithering e noise-shaping. Questo è necessario ogni qual volta viene eseguita un'elaborazione. Il motivo di ciò è che i calcoli possono portare a risultati che hanno più precisione di quanto possa essere espressa nella risoluzione supportata dai DAC. Semplicemente troncando o arrotondando un risultato per adattarsi alla precisione del DAC causa distorsione, la quale è direttamente correlata al segnale. Il dither nasconde questo errore di arrotondamento con rumore costante ad un livello molto basso non udibile (un po' come il rumore termico) - per cui non è più legato al segnale. Il noise-shaping fa un passo ulteriore spostando questo rumore a frequenze inferiori o ultrasoniche. Soprattutto i convertitori multi-bit, ma in parte anche gli altri, beneficiano di upsampling con noise-shaping attraverso un migliore linearità.
Il noise-shape non è consigliato per frequenze di uscita a 44.1/48 kHz, perché non c'è spazio a disposizione in frequenza dove spostare il rumore.
Ci sono vari tipi di noise-shaper:
NB: Si consiglia di non usare "NS1" con apparecchiatura sensibile a rumore ultrasonico.
I modulatori del 5° ordine sono più adatti a DAC che hanno filtri semplici di ricostruzione analogica. I modulatori del 7° ordine forniscono una performance tecnica più elevata, ma stressano maggiormente i filtri analogici a bordo del DAC. Di solito, ciò significa che i modulatori del 5° ordine sono più adatti a DAC con un unico elemento switching, mentre i modulatori del 7° ordine forniscono potenzialmente una performance migliore con DAC che hanno a bordo arrays di multi-elementi switching. I modulatori di tipo DSD* sono a configurazione fissa, mentre quelli ASDM* sono adattivi che si basano in varie maniere sul segnale di partenza.
La terza selezione è l'impostazione per le frequenze di campionamento disponibili in uscita, sulla base dell'hardware e del filtro selezionato.
In generale, consiglio di scegliere tra i filtri "poli-sinc-*" e con più alta frequenza di campionamento possibile. Il dither o noise-shaper è scelto sulla base della descrizione di cui sopra: "NS9" per uscita a 192 kHz, "NS5" per uscita a 384 kHz e "TPDF" o "Gauss1" per eventuali frequenze più basse...
Per i filtri seguirei queste indicazioni:
- filtri a fase minima per produzioni studio di musica non-classica;
- filtri a fase lineare per musica classica e acustica registrata con microfonazione minima.
Passiamo ora alla configurazione di segnale DSDIFF/DSF (DSD) da convertire in PCM. Il contenuto DSD64 2.8 MHz viene convertito in PCM a 176,4 kHz e il contenuto 5,6 MHz DSD128 in PCM a 352,8 kHz. Questi formati intermedi possono essere ulteriormente convertiti in qualsiasi altra frequenza di uscita supportata utilizzando i metodi descritti in precedenza.
Nella finestra DSDIFF/DSF Settings ci sono due selezioni - il tipo di conversione e il filtro antirumore.
Il tipo di conversione definisce come la modulazione delta-sigma viene convertita in formato PCM a frequenza più bassa:
- "Normal" è il metodo tradizionale a più stadi di effettuare la conversione, questo è molto simile ad come un moderno chip delta-sigma ADC fa la conversione PCM in uscita;
- "Single-steep" è una conversione/brickwall a singolo passaggio, tecnicamente ha risultati molto precisi;
- "Single-short" è una conversione a singolo passaggio più delicata, introduce molto meno ringing del tipo "steep". Uso per lo più questa conversione.
- "sinc-S" fase lineare adattiva e un roll off ripido, con un algoritmo di conversione a singolo passaggio ad alta attenuazione. Il numero di taps è 65536.
- "sinc-M" fase lineare adattiva e un roll off ripido, con un algoritmo di conversione a singolo passaggio ad alta attenuazione e 1 milione di taps.
- "poli-*" queste sono simili ai "poli-sinc-*" citati in precedenza, sono eseguite in un unico passaggio, ma richiedono una CPU parecchio potente. Ultimamente però sono stati estremamente ottimizzati e ora sono molto più veloci oltre che più precisi. Ora questi sono tra i filtri con minore carico della CPU, pur avendo la migliore qualità, per cui è la scelta più consigliata per la conversione.
- "poli-xtr" fase lineare e un roll off molto ripido, con un algoritmo di conversione a singolo passaggio ad altissima attenuazione.
- "poli-ext2" fase lineare con estensione di frequenza e un roll off ripido, con un algoritmo di conversione a singolo passaggio ad alta attenuazione.
- "poli-gauss-long" fase lineare di tipo gaussiano, con un algoritmo di conversione a singolo passaggio ad altissima attenuazione. Riposta ottimale della frequenza in funzione del tempo.
- "none" nessuna decimazione, il campionamento di uscita intermedio è uguale a quello DSD di partenza.
Il filtro antirumore è usato per ridurre il rumore ultrasonico ad alta frequenza della modulazione delta-sigma presente nei dati di partenza. I filtri Standard lasciano un livello basso di rumore ultrasonico. Alcuni diffusori possono avere dei tweeters con capacità ridotta ai bassi livelli che sono sensibili a questo rumore, specialmente ad alti volumi. Inoltre, alcuni amplificatori con un design scarso possono comportarsi male in presenza di tale rumore ultrasonico. Per cui possono essere selezionati dalla lista filtri di rumore più aggressivi. Tali filtri limiteranno anche la banda audio disponibile. Quando viene processato un segnale sorgente DSD (ad es. DSD64) a 88.2/96 kHz PCM, usare un filtraggio ulteriore oltre a quello "standard" è poco importante, dato che la maggior parte del rumore verrà tagliato. D'altra parte, se il segnale in uscita 44.1/48 kHz, non c'è bisogno di usare un filtraggio ulteriore oltre a quello "standard", anzi ridurrebbe la qualità audio in uscita.
I seguenti filtri sono supportati:
- "Standard" questo è il filtro standard per SACD/Scarletbook. Consigliato per la maggior parte dei casi;
- "Low" questo ha angolo di transizione inferiore a quello standard, utile per apparecchiature sensibili al rumore ultrasonico della modulazione delta-sigma. Una buona alternativa a quello standard.
- "sac" convertitore a media mobile.
- "wec" convertitore a elementi ponderati.
- "Slow-*" filtri antirumore dolci a fase minima e lineare. Un filtro antirumore più aggressivo del precedente;
- "Fast-*" filtri antirumore ripidi a fase minima e lineare. Il filtro antirumore più aggressivo di tutti.
Ci sono tre tipi di integratori delta-sigma a disposizione per la rimodulazione SDM -> SDM. Questi hanno in particolare effetto sulla frequenza e sul responso di fase alle alte frequenze.
- "IIR" integratore di tipo IIR normale.
- "FIR" integratore di tipo FIR pesato.
- "CIC" integratore di tipo "pettine a cascata".
Ci sono opzioni differenti per la conversione SDM -> SDM. Queste hanno effetto sull'apertura in frequenza che si presume contenga segnale utile oltre a modulazione di rumore. Ad esempio, il piano non contiene armoniche ad alta frequenza e in questo caso si consiglia "narrow"; mentre registrazioni di percussioni con microfono ravvicinato normalmente contengono segnale ad alta frequenza e in quel caso "wide" è consigliable. Default è "wide".
- "wide" segnale a banda larga.
- "narrow" segnale a banda stretta.
Poi c'è l'impostazione "6 dB di guadagno", dal momento che nelle specifiche DSD è indicato di usare max -6 dB del livello massimo teorico, il livello può sembrare più basso dopo la conversione rispetto al PCM. Questa impostazione consente 6 dB di guadagno per livellare il livello massimo specificato DSD con il livello massimo possibile del PCM. Tuttavia, tale settaggio deve essere utilizzato solo per il contenuto che non supera il massimo specificato. Pare, infatti, che ci siano in giro registrazioni che superano il livello massimo e quindi ciò provocherebbe un sovraccarico. Se questo porta a limitare il livello in realtà dipende dall'impostazione del volume di HQPlayer.
Nella stessa finestra di dialogo ci sono altre due impostazioni relative alla riproduzione di DSD nativo.
- Quando "DirectSDM" è abilitato, il motore interno di elaborazione delta-sigma per contenuti DSD viene bypassato. Il motore è comunque in grado delle medesime funzionalità disponibili per PCM, tra cui il controllo del volume, il ritardo e la convoluzione per la correzione digitale della stanza (DRC). Dal momento che DSD è "Direct Stream Digital", è giusto fornire anche questo settaggio per il percorso diretto.
- "Direct playback type" è la selezione per mandare in uscita diversi tipi di DSD-over-PCM supportati da alcuni apparecchi di riproduzione per fare playback di DSD nativo. Fino ad oggi l'attrezzatura è spesso compatibile con "DoP marker", a meno che non ci sia un driver ASIO DSD nativo (in questo caso è sufficiente "Native/none").
Modalità di uscita SDM (1-bit delta-sigma, o DSD in altre parole).
Quindi HQPlayer può eseguire tutti i tipi di lavorazione: PCM->PCM, DSD->PCM, PCM->DSD e ovviamente DSD->DSD.
Quando viene selezionata la modalità di uscita SDM nella finestra principale, la scelta dei filtri serve per controllare le modalità di "oversampling" corrispondenti alle descrizioni fatte in precedenza. Il tipo di dithering serve per controllare la scelta del modulatore delta-sigma reale. Il selettore di frequenza di campionamento di uscita mostra le frequenze SDM in MHz, invece delle frequenze PCM in kHz.
Vi è inoltre la possibilità di eseguire conversioni come da 192 kHz PCM a 2.8 MHz DSD, oppure 2.8 MHz DSD a 5.6 MHz DSD (o viceversa). Quando l'elaborazione è eseguita da ingresso a uscita DSD->DSD, tutta l'elaborazione viene eseguita alla frequenza nativa, mai ad una frequenza PCM inferiore. La conversione DSD->PCM si applica solo quando viene selezionata la modalità di uscita PCM e il file in riproduzione è DSD.
Nota importante! Durante l'esecuzione di qualsiasi lavorazione con DSD in uscita, non cercate di impostare il volume al massimo, utilizzate qualcosa di ragionevole come un'impostazione -3 dB max. Il DSD funziona meglio quando non è spinto al massimo.