In breve: No.
Non è un segnale analogico, che più lo maneggi e più lo degradi. È uno stream di dati digitale. Una sequenza di numeri. Il sistema o funziona o è rotto. Se funziona è praticamente "incorruttibile". Dimenticatevi le vere e proprie bufale audiofile che sono state diffuse (per ignoranza o malafede, per interessi commerciali...) a proposito dei presunti errori nei dati dei sistemi digitali: a meno di non avere a che fare con un sistema malfunzionante, nei sistemi digitali gli errori nei dati o non esistono affatto o sono talmente rari da essere totalmente ininfluenti.
Per altro, se per assurdo così non fosse, seguendo il tuo ragionamento, per minimizzare il numero di "passaggi" dovremmo abbandonare la liquida e tornare ai vecchi lettori CD/DVD/SACD...
Ho l'impressione che purtroppo molti abbiamo ancora le idee molto confuse su cosa sia e come funzioni un sistema audio digitale. Vorrei perciò ribadire alcuni concetti fondamentali.
Un segnale audio può essere visto come la combinazione di due "informazioni", strettamente legate tra loro:
1) ampiezza
2) tempo
Questo sempre, sia che si abbia a che fare con un sistema analogico che con uno digitale.
In un sistema analogico l'informazione è costituita da un (unico) segnale "
continuo", variabile nel tempo, che può assumere
qualsiasi valore. L'informazione temporale è intrinseca, contenuta nel segnale stesso.
Quando abbiamo a che fare con un sistema di registrazione e riproduzione, l'informazione temporale (relativa) viene (deve necessariamente essere) convertita in un'altra grandezza (non tempo-variante). Tipicamente l'informazione temporale viene convertita in una dimensione spaziale (ad es. la posizione lungo il solco del disco o sul nastro magnetico) con l'ausilio di una "base dei tempi" fissa predefinita (la velocità di rotazione del disco, quella di trascinamento del nastro, ecc).
In un sistema digitale l'informazione relativa all'ampiezza è costituita invece da un segnale "
discreto". Nella fattispecie da una
sequenza di numeri. Che sono rappresentati in qualche modo attraverso una (qualsiasi) codifica digitale opportuna. L'informazione temporale in questo caso è "
estrinseca" (non è parte integrante "del segnale", cioè dei dati) ed è rappresentata da una opportuna "base dei tempi" (fornita da un segnale di clock). Tale base dei tempi (che non è necessariamente legata in alcun modo con i diversi segnali di clock utilizzati nei sistemi di trasporto dei dati) può essere trasmesso insieme ai dati stessi oppure separatamente da questi.
Quando abbiamo a che fare con un sistema di registrazione digitale, l'informazione temporale viene semplicemente... buttata via. Ci basta infatti avere la sola informazione "a priori" su quale sia la giusta frequenza della "base dei tempi" (cioè la frequenza di campionamento) da utilizzare. Sarà poi un opportuno oscillatore di clock del sistema di riproduzione a fornirci una base dei tempi nuova di zecca.
Attenzione: sebbene tipicamente si tratti sempre di un segnale "rettangolare", "a due livelli" (il che potrebbe far erroneamente pensare ad una sua natura "digitale"), in realtà il segnale di clock
non è un segnale digitale ma al contrario è a tutti gli effetti un segnale
analogico!
L'informazione utile di un segnale di clock non è infatti contenuta nella sua ampiezza, ma
solo negli istanti esatti delle transizioni di livello. Che possono avvenire in qualsiasi istante (=>variabilità continua=>segnale analogico) e non sono mai determinate/determinabili in modo "perfetto".
Tale (piccola) indeterminazione nella base dei tempi è in sostanza ciò che chiamiamo "
jitter". Che in parole povere altro non è se non l'equivalente digitale del "
Wow & flutter" dei sistemi analogici (solo che nel dominio digitale cambiano sostanzialmente i valori delle grandezze in gioco, nonché gli effetti pratici sul segnale di uscita. Che non si limitano a variazioni/modulazioni del "
pitch" ma comportano tra l'altro anche fenomeni di distorsione non lineare, ecc).
Ed è proprio quella l'origine di tutti i nostri problemi.
Così come per i dischi o i nastri analogici, anche nel caso dei sistemi di riproduzione digitale la base dei tempi assume importanza (fondamentale) solo in alcuni momenti ben precisi durante la fase di produzione e di riproduzione. Nella fattispecie quando questa viene "combinata" con il segnale analogico per ottenere lo stream digitale (campionamento, nella conversione A/D, oppure incisione del disco o registrazione del nastro analogico, ecc...) e quando poi alla fine viene reintrodotta per riottenere il segnale analogico finale (conversione D/A da una parte, "lettura" del disco o del nastro analogico dall'altra).
A meno che non possa avere una qualche influenza diretta o indiretta sul processo finale, tutto ciò che avviene "a monte" (ad es. i vari clock con i quali uno stream di dati viene letto da un HDD, trasferito su un bus SATA, PCIe, USB, rete Ethernet, ecc) non ha la benché minima importanza.
Cioè: ciò che avviene "a monte" ha né più né meno che la stessa importanza che può avere l'eventuale velocità con cui fai girare tra le tue mani un LP mentre lo trasferisci dallo scaffale al piatto del giradischi...
Al contrario, ad essere fondamentale è la precisione e (soprattutto) la "costanza" (cioè il basso jitter) della base dei tempi utilizzata dal DAC per ricostruire il segnale audio analogico di uscita.
È per questo che è fondamentale che tale base dei tempi sia estremamente stabile ed a basso jitter / phase noise, proprio laddove serve (cioè nel chip del DAC) e non altrove.
Perciò è necessario che l'oscillatore di clock che fornisce tale base dei tempi abbia caratteristiche adeguate e sia quanto più vicino possibile al chip del DAC (la trasmissione del segnale di clock lungo le piste di un circuito stampato e/o dei cavi ne degrada le caratteristiche, aumentando il jitter). È altresì necessario che che le alimentazioni (
e le masse!) del/degli oscillatori di clock nonché di tutti i circuiti che trattano tale segnale (ovviamente DAC incluso) siano estremamente stabili e "pulite", perché le fluttuazioni delle tensioni di alimentazione si trasformano in variazioni delle soglie di commutazione e quindi in fluttuazioni della base dei tempi. Ecc, ecc.
Che mi si venga a dire che, per evitare un passaggio intermedio attraverso un bus USB (asincrono...), utilizzare un segnale I²S generato dall'oscillatore di clock -scadente e male alimentato- di un SoC, "lontano" dal DAC, in presenza di quantità significative di rumore ed interferenze di ogni genere, ecc, sia preferibile rispetto all'uso di una interfaccia dedicata che usa clock dedicati e di qualità adeguata, con alimentazioni dedicate, che implementa (o dovrebbe implementare...) ogni accortezza per preservare l'integrità dei segnali, ecc... è (per essere buoni) a dir poco inverosimile.
Che poi i risultati -soggettivi- possano essere gradevoli o addirittura (in qualche dato contesto specifico, soggettivamente) preferibili... può anche essere, non metto certo in dubbio le percezioni altrui. A parte i soliti effetti prettamente psicoacustici, è anche possibile che quantità significative di jitter con caratteristiche (casualmente) opportune mascherino altri difetti e/o producano distorsioni eufoniche, o magari producano addirittura effetti analoghi a quelli del dithering.
Comunque sia, è però a dir poco improbabile ed inverosimile che sia più corretto...