2. Architettura “Kepler” - Parte seconda

 

La GeForce GTX 680 integra la prima incarnazione di “Kepler” dedicata alla fascia alta del mercato, ovvero la GPU GK104.

Come per le GPU “Fermi”, NVIDIA ha scelto anche per “Kepler” un approccio modulare che consente di far derivare da un unico progetto differenti GPU modificando il numero di unità di elaborazione, senza doverne sconvolgere l’architettura.


NVIDIA GeForce GTX 680 : ecco Kepler! 2. Architettura

 

L'incremento delle unità di elaborazione (3 volte quelle presenti nella GTX 580) e l’eliminazione dello Shader Clock (2x GPU Clock) rende la GeForce GTX 680 più simile alle concorrenti AMD che da molti anni utilizzano questo tipo di approccio, diametralmente opposto a quello di GF110.

 

GPC (Graphics Processing Cluster)

Nelle GPU GK104 sono presenti quattro Graphics Processing Cluster, per un totale di 1536 CUDA Cores.

 

NVIDIA GeForce GTX 680 : ecco Kepler! 2. Architettura   NVIDIA GeForce GTX 680 : ecco Kepler! 2. Architettura  


Ogni GPC in “Kepler” è composto da due unità SMX, in “Fermi” erano invece presenti quattro unità SM.

In ogni GPC troviamo un Raster Engine, un’unità composta da tre stadi che si occupa di processare i dati ricevuti dalle unità SMX, elaborando i triangoli e le relative equazioni degli spigoli.

Il Raster Engine si occupa di rimuovere dalla computazione tutti i triangoli non visibili nella scena che deve essere rappresentata, riducendo il bandwidth necessario.

Complessivamente ogni Raster Engine riesce a produrre 32 pixel per clock.

Per ottimizzare le performance per ogni Raster Engine è disponibile una ROP per il collegamento alla memoria video, seguendo un rapporto 1:1.

 

Memory Controller

NVIDIA ha deciso di utilizzare quattro controller di memoria a 64bit ottenendo quindi un bus a 256 bit, 128 in meno della diretta concorrente AMD Radeon HD 7970.

Questa scelta potrebbe sembrare un passo indietro rispetto a quanto presente nell’architettura “Fermi”, tuttavia l’ampiezza di banda complessiva risulta praticamente equivalente grazie all’utilizzo di memorie GDDR5 con una frequenza di ben 6GHz.

 

NVIDIA GeForce GTX 680 : ecco Kepler! 2. Architettura
Analisi dei segnali delle memorie GDDR5 @ 6GHz


Per ottenere frequenze operative così elevate NVIDIA ha dovuto lavorare sulla gestione dei segnali delle memorie, ridisegnando completamente l’interfaccia di comunicazione per garantirne la completa stabilità.

 

Cache L2

In aggiunta alla cache L1 integrata nei moduli SMX, “Kepler” mette a disposizione 512KB di cache di secondo livello, condivisa tra tutte le unità di elaborazione.

Per supportare l’incremento di potenza dei moduli SMX, il cache hit bandwidth è stato aumentato del 73%, lavorando in particolare sull’efficienza delle operazioni Atomiche.