1. Ada Lovelace in pillole


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 1 


Durante l'evento di lancio del 20 settembre, NVIDIA ha svelato la sua nuova serie di schede grafiche basate sull'architettura Ada Lovelace, che porta con sé importanti novità in grado di rivoluzionare l'intero mercato.

A capitanare la lineup troviamo la tanto attesa GeForce RTX 4090, scheda pensata non solo per i più incalliti videogiocatori, ma anche per i professionisti del rendering, grazie ad un salto generazionale che si approssima al doppio di potenza bruta a risoluzione nativa ed un quasi incredibile 4x con DLSS attivo.


Architettura Ada Lovelace - NVIDIA AD102

Il cuore della nuova top di gamma è costituito dal processore grafico Ada Lovelace AD102, realizzato tramite processo produttivo TSMC 4N e con una superficie complessiva di 608mm2, dentro al quale troviamo ben 76 miliardi di transistor organizzati in 7 differenti cluster grafici, similmente a GA102.

Analoga anche la presenza di 6 TPC e 2 SM, i quali contano al loro interno 4 sub-core ciascuno.


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 2 


La nuova GPU AD102 è dotata di ben 18432 CUDA Core, 144 RT Core, 576 Tensor Core e 576 unità dedicate alle texture.

La memoria è gestita da 12 controller a 32-bit per un'interfaccia complessiva a 384-bit.

Non mancano 3 moduli NVENC di ottava generazione accoppiati a 3 moduli NVDEC di quinta generazione ed il nuovissimo Optical Flow Accelerator di cui parleremo in dettaglio più avanti in questo articolo.

A livello di architettura, la novità principale riguarda la struttura dei GPC e, più nello specifico, l'interno degli SM con alcune importanti migliorie riguardanti la configurazione di core FP32 e INT32.

Ogni sub-core sarà composto da 128 unità FP32 e 192 unità combinate FP32+INT32, supportate da 192kB di cache L1 per SM (un aumento complessivo del 50% rispetto alla precedente generazione) che porta il totale di cache L1 a 4,5MB.

A questi si aggiungono un RT Core di terza generazione, quattro Tensor Core di quarta generazione, quattro unità texture, ed un Register File da 256kB.


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 3


Presenti, ma non visibili negli schemi soprastanti, sono 288 unità FP64 (2 per SM) che, nonostante la loro potenza di calcolo effettiva sia una minuscola frazione delle operazioni FP32, garantiscono il funzionamento di qualsiasi programma che sfrutta codice di tipo FP64, incluse alcune operazioni gestite lato Tensor Core.


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 4


Salendo di livello troviamo un esorbitante valore di 96MB di cache L2, ben 16 volte maggiore rispetto alla GPU GA102.

Infine, il numero di ROP per Graphics Processing Cluster viene incrementato notevolmente raggiungendo un totale di 32.

Si parla, dunque, di un importante salto dai 112 ROP della RTX 3090 Ti ai 176 ROP complessivi presenti sulla RTX 4090.


GeForce RTX 4090 - Specifiche

ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 5 


Tornando alle specifiche della nuova ammiraglia NVIDIA, sotto la scocca abbiamo quindi 128 SM (dei 144 totali potenzialmente disponibili sul chip) per un totale di 16.384 CUDA core, 176 ROP, 512 TMU e 96MB di cache L2.

Disponibile in un'unica configurazione di memoria, la 4090 è equipaggiata con 24GB di GDDR6X da 21 Gbps su interfaccia a 384 bit per una larghezza di banda complessiva di 1 TB/s.

Per quanto concerne i consumi, il TBP è fissato a 450W e la scheda sarà alimentata da un singolo cavo con connettore 12VHPWR (12+4 pin).


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 6 


Spostandoci sulle prestazioni in gioco, NVIDIA promette un incremento compreso tra 2x e 4x mostrandoci tre differenti titoli utilizzati per i test, ovvero Microsoft Flight Simulator, Warhammer 40,000: Darktide e Cyberpunk 2077.

Il prezzo di listino per il mercato italiano della versione Founders Edition è di 1979€.


Ada Lovelace - Tecnologie

Ma le GPU Ada Lovelace non sono solo potenza bruta, al contrario l'azienda ha voluto concentrare gran parte delle risorse sullo sviluppo di nuove tecnologie per utilizzare in maniera ancora più efficiente la potenza di calcolo a loro disposizione.

"Ada", nickname utilizzato dal CEO, aggiorna tutte e tre le unità computazionali RTX.

Concretamente si parla di nuovi SM da 90 TFLOP con un'efficienza doppia rispetto alla precedente generazione, che potranno fare affidamento su una nuovissima tecnologia di gestione in tempo reale della pipeline chiamata "Shader Execution Reordering" (SER) la quale dovrebbe garantire una velocità di esecuzione doppia rispetto al passato.

Il concetto alla base di questa tecnologia riguarda la natura intrinseca delle moderne GPU, che operano in maniera più rapida ed efficiente mentre lavorano sul medesimo tipo di operazione.

Potendo riorganizzare la catena di esecuzione, il carico sugli Streaming Multiprocessor dovrebbe portare a tangibili incrementi prestazionali.


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 7 


Rinnovati anche gli RT Core ed i Tensor Core, rispettivamente alla terza e quarta generazione, accoppiati a due nuovi moduli: l'Opacity Micromap Engine in grado di accelerare l'alpha-test di un fattore doppio rispetto alla corrente generazione ed il Displaced Micro-Mesh Engine, capace di generare mesh e micro triangoli che consentono agli RT Core di tracciare geometricamente oggetti complessi o scene senza particolare impatto su BVH o memorie.


ASUS ROG Strix GeForce RTX 4090 OC 1. Ada Lovelace in pillole 8 


Da ultima abbiamo la tecnologia DLSS aggiornata alla versione 3, che apporta radicali modifiche al sistema di intelligenza artificiale generando interi frame al posto di singoli pixel.

Il suo funzionamento è garantito da quattro componenti: un nuovo Optical Flow Accelerator, i vettori di movimento di gioco, un Autoencoder AI convoluzionale e la Reflex super-low-latency pipeline.

Il DLSS 3 analizzerà il frame attuale ed il frame successivo in bassa risoluzione (1080p) per scoprire come la scena cambierà.

L'Optical Flow Accelerator genererà un set di vettori composti da direzione e velocità per ogni pixel che sarà poi passato alla rete neurale insieme agli elementi geometrici della scena, così da generare i frame intermedi che costituiranno la nuova scena in alta risoluzione.

Il suo funzionamento autonomo, oltre a garantire incrementi prestazionali fino a 4 volte superiori, non necessita di elaborazione a livello di CPU rimuovendo parte dei limiti imposti lato processore su alcuni titoli particolarmente intensi a livello computazionale quali Microsoft Flight Simulator.

Tra gli esempi più eclatanti, l'azienda ci mostra come, all'interno di Cyberpunk 2077, l'attivazione del DLSS 3 porti ad un passaggio da 23 FPS a poco meno di 100 FPS al prezzo di una perdita di dettaglio quasi impercettibile.