1. Pillole di Ampere - Architettura
Durante l'evento ufficiale di lancio NVIDIA ha rilasciato diverse indiscrezioni riguardanti le tecnologie che caratterizzano la seconda generazione di schede RTX.
Nei paragrafi a seguire andremo ad approfondire tutti i dettagli tecnici, facendo particolare attenzione alla nuova architettura Ampere e alle novità riguardanti il supporto software.
Volendoci focalizzare sulla parte tecnica ometteremo tutte le informazioni di carattere generico, rimandando il lettore all'articolo con cui abbiamo coperto l'evento di lancio.
Non è assurdo pensare che con Turing gran parte del prezzo giustificava l'introduzione della nuova tecnologia RTX; Ampere rappresenta infatti una diretta evoluzione della prima generazione con un'architettura del tutto similare che vede l'introduzione di nuovi SMs, RT Cores e Tensor Cores, più potenti, efficienti e numerosi.
Il risultato è un incremento prestazionale impressionante e che vede la sua espressione più palese nella RTX 3070, scheda che rende obsoleta l'ex flagship RTX 2080 Ti (1279€) a soli 519€.
Modelli | GeForce RTX 3070 | GeForce RTX 3080 | GeForce RTX 3090 |
GPU | Ampere GA104-300 | Ampere GA102-200 | Ampere GA102-300 |
Processo produttivo | Samsung 8nm | Samsung 8nm | Samsung 8nm |
Dimensioni chip | 395.2mm2 | 628.4mm2 | 628.4mm2 |
Tranistor | 17.4 miliardi | 28 miliardi | 28 miliardi |
CUDA Cores | 5888 | 8704 | 10496 |
Boost Clock | 1.73GHz | 1.71GHz | 1.7GHz |
Quantitativo memoria | 8/10 GB GDDR6 | 10/20 GB GDDR6X | 24 GB GDDR6X |
Interfaccia memoria | 256-bit | 320-bit | 384-bit |
Velocità memoria | 14 Gbps | 19 Gbps | 19 Gbps |
RT Cores | 2a generazione | 2a generazione | 2a generazione |
Tensor Cores | 3a generazione | 3a generazione | 3a generazione |
Architettura | Ampere | Ampere | Ampere |
DirectX 12 Ultimate | Sì | Sì | Sì |
NVIDIA DLSS | Sì | Sì | Sì |
PCIe 4.0 | Sì | Sì | Sì |
NVIDIA Ansel | Sì | Sì | Sì |
NVIDIA FreeStyle | Sì | Sì | Sì |
NVIDIA ShadowPlay | Sì | Sì | Sì |
NVIDIA Highlights | Sì | Sì | Sì |
NVIDIA G-SYNC | Sì | Sì | Sì |
Driver Game Ready | Sì | Sì | Sì |
Driver NVIDIA Studio | Sì | Sì | Sì |
NVIDIA GPU Boost | Sì | Sì | Sì |
NVIDIA NVLink | - | - | Sì |
Vulkan RT, OpenGL | Sì | Sì | Sì |
HDMI 2.1 | Sì | Sì | Sì |
DisplayPort 1.4a | Sì | Sì | Sì |
NVIDIA Encoder | 7a generazione | 7a generazione | 7a generazione |
NVIDIA Decoder | 5a generazione | 5a generazione | 5a generazione |
Buona parte del merito è di Samsung con il processo produttivo a 8nm appositamente pensato per queste schede, grazie al quale NVIDIA ha moltiplicato la densità di transistor a livello di GPU, 28 miliardi in soli 628 mm², più di 44 milioni per mm².
Ciò impatta direttamente sulle prestazioni per watt con un incremento che il produttore traduce in un salto del 90% rispetto alla precedente serie Turing.
Ovviamente ritroviamo, come per la precedente generazione, le tecnologie RTX e DLSS oltre che l'introduzione di una serie di nuove funzionalità come RTX IO, NVIDIA Reflex e altri prodotti appositamente progettati per i creatori di contenuti, dei quali parleremo più avanti in questa pagina.
Architettura Ampere - NVIDIA GA102
Il top di gamma di nuova generazione è il chip GA102 che, a differenza delle passate schede RTX, accomuna sia la RTX 3090 (ricordiamo essere la nuova TITAN) che la RTX 3080.
Su quest'ultima questo impressionante circuito da 28 miliardi di transistor offre 30 TFLOPS FP32, 58 RT TFLOPS e fino a 238 tensor TFLOPS con 8704 CUDA Cores suddivisi tra 68 streaming multiprocessors (SMs): parliamo di un incremento teorico del 183% rispetto alla RTX 2080 Super.
In alto possiamo osservare il diagramma a blocchi della GPU GA102-200 che equipaggia la RTX 3080.
Come già anticipato, ritroviamo una struttura praticamente identica a quella di TU102 che si differenzia per la presenza dell'interfaccia PCI Express 4.0 x16 e 10 controller di memoria da 32-bit ciascuno (320-bit totali) che si collegano a memorie GDDR6X di ultima generazione in grado di raggiungere una velocità di trasferimento di 19 Gbps.
Assente l'interfaccia NVLink alla quale NVIDIA sembrerebbe voler dire addio, abbandonando il supporto SLI per tutte le schede consumer (rimane presente solo sulla RTX 3090).
Troviamo invece la massima evoluzione del chip sulla RTX 3090 con la variante GA102-300 che ne sprigiona tutto il potenziale: 10496 CUDA Cores, 36 TFLOPs FP32, 69 RT TFLOPs e 285 Tensor-TOPs, il tutto accompagnato da ben 24GB GDDR6X con interfaccia 384-bit e velocità di 19.5 Gbps.
La GeForce RTX 3090 è sulla carta un vero e mostro di potenza, pronta a rompere la barriera del 4K e tuffarsi direttamente nel gaming 8K, pur con alcune limitazioni.
Ma il vero target di questo modello non è comunque il mercato videoludico, bensì il mondo dei creatori di contenuti che vogliono il massimo che l'hardware possa offrire.
Simile anche la struttura di ogni SM, sempre composto da quattro scheduler questa volta con 32 FP32 CUDA Cores, di cui 16 in grado di effettuare parallelamente operazioni INT32 e FP32.
Anche qui ritroviamo 128kB di memoria cache L1.
Memoria GDDR6X
Una delle principali novità introdotte da NVIDIA, e frutto di una collaborazione per ora esclusiva con Micron, è la tecnologia GDDR6X.
L'applicazione è simile a quanto già avviene con le GDDR6 ma sfrutta la modulazione PAM4 (Pulse Amplitude Modulation 4) che introduce due step di tensione al segnale.
Banalmente, al posto di utilizzare unicamente i valori zero e uno come comunemente concepito dal classico sistema binario, il segnale verrà trasmesso sui livelli 00, 01, 10 e 11, permettendo così la comunicazione di 4 differenti valori all'interno dello stesso ciclo.
Al momento della stesura di questo articolo, la tecnologia GDDR6X è esclusiva di RTX 3080 e RTX 3090.