NVIDIA GeForce GTX 680 : ecco Kepler!

1. Architettura â€œKeplerâ€ - Parte prima

Con â€œKeplerâ€ NVIDIA ha ridisegnato lâ€™architettura delle sue GPU modificando profondamente il progetto originale basato sullâ€™architettura â€œFermiâ€, spostando il focus dalle pure prestazioni allâ€™efficienza.

Le schede delle serie GTX 400 e GTX 500 erano risultate eccellenti sotto il profilo delle performance, tuttavia il calore prodotto e lâ€™assorbimento energetico hanno rappresentato il tallone di Achille su cui NVIDIA ha dovuto lavorare molto attentamente.

Lâ€™introduzione del processo produttivo a 28nm da parte di TSMC ha sicuramente aiutato NVIDIA in questo compito, riducendo la dimensione ed i consumi dei singoli transistor, ma questo cambiamento non sarebbe stato sufficiente per giungere allâ€™obbiettivo previsto senza una revisione delle unitÃ di elaborazione della GPU.

Next Generation SM (SMX)

Il â€œmattoncinoâ€ alla base dellâ€™array di calcolo delle GPU basate su architettura â€œFermiâ€ Ã¨ lâ€™unitÃ di elaborazione SM, dotata di 32 CUDA Cores e di una logica di controllo; in â€œKeplerâ€ lâ€™unitÃ di base Ã¨ il nuovo SMX, composto da ben 192 CUDA Cores.

Â	SMX Cluster 192 CUDA Cores 16 Texture Units PolyMorph Engine 2.0 2x Perf/Watt rispetto a Fermi Minimizzato il controllo in Hardware

Lâ€™aggregazione di piÃ¹ unitÃ di calcolo sotto ad unâ€™unica logica di controllo riduce sensibilmente il numero di transistor dedicati ai compiti di gestione, lasciando piÃ¹ spazio alle unitÃ di elaborazione.

NVIDIA GeForce GTX 680 : ecco Kepler! 1. Architettura

Il controllo e la schedulazione delle operazioni non Ã¨ piÃ¹ gestita completamente in hardware come avviene in â€œFermiâ€, ma viene gestita in parte via software eliminando tutta lâ€™elettronica dedicata al riordino delle operazioni che in una scheda video non Ã¨ di fondamentale importanza, poichÃ¨ la sequenza delle operazioni Ã¨ deterministica e la latenza dei componenti Ã¨ predicibile.

NVIDIA GeForce GTX 680 : ecco Kepler! 1. Architettura

Nellâ€™architettura â€œFermiâ€ la frequenza di funzionamento dei CUDA Cores Ã¨ doppia rispetto a quella della GPU; in â€œKeplerâ€ non esiste piÃ¹ questa distinzione e tutti i componenti operano con lo stesso clock.

La scelta di utilizzare una frequenza di funzionamento doppia era nata durante lo sviluppo delle GPU Tesla, per massimizzare la velocitÃ delle unitÃ di elaborazione senza dover incrementare il consumo delle altre unitÃ non sfruttate in ambito GP-GPU.

La semplificazione della gestione dei clock garantisce una sostanziale riduzione dei consumi e un complessivo aumento dellâ€™efficienza non dovendo piÃ¹ gestire il doppio dei clock per ogni ciclo.

PolyMorph Engine 2.0

Uno dei componenti che ha ricevuto un sostanziale miglioramento in â€œKeplerâ€ Ã¨ il PolyMorph Engine che consente di ottenere un significativo miglioramento nelle performance negli applicativi DirectX 11 che fanno uso del motore di tassellazione.

La tassellazione Ã¨ una tecnica che consente di aumentare artificialmente il numero dei poligoni per ogni oggetto, senza perÃ² incrementare la complessitÃ del modello 3D, applicando su di un modello piÃ¹ semplice una serie di mappe che consentono di aggiungere dettagli allâ€™immagine.

La tassellazione avviene nella fase finale di generazione dellâ€™immagine ed Ã¨ totalmente gestita dalla GPU; non câ€™Ã¨ quindi transito di dati verso la memoria video che rappresenta il principale collo di bottiglia nella gestione di complessi modelli 3D.

La GPU GK104 su cui Ã¨ bastata la GeForce GTX 680 Ã¨ dotata di 8 PolyMorph Engine, la metÃ rispetto a quelli di una GeForce GTX 580, tuttavia la versione 2.0 consente di raddoppiare le performance per clock rispetto alla versione integrata in â€œFermiâ€ e, grazie alle frequenze operative maggiori, consente di aumentare sensibilmente le performance in workload che fanno largo uso della tassellazione.