AMD Bulldozer e Bobcat - Anteprima architettura

Nel corso degli anni sono state sviluppate due tecnologie per il supporto allâ€™esecuzione di piÃ¹ threads in contemporanea:

SMT (Simultaneous Multi Threading): Forza lâ€™esecuzione di due threads in un solo core sfruttando il non completo utilizzo di tutte le risorse disponibili. Ogni threads deve â€œcombattereâ€ per ottenere le risorse di cui ha bisogno ed eventualmente attendere lâ€™esecuzione dellâ€™altro thread per proseguire.
CMP (Chip Level Multiprocessing): Ogni thread ha un core dedicato, Ã¨ un approccio di forza bruta, rispetto al SMT, la condivisione di risorse Ã¨ a livello piÃ¹ alto e, in caso di numerose risorse condivise, un intero core puÃ² restare in attesa della terminazione degli altri processi causando un grande sottoutilizzo del sistema.

AMD Bulldozer e Bobcat - Anteprima architettura 1. Bulldozer - Parte 1 1

SMT Ã¨ stato il primo approccio al multi threading ed ha portato a notevoli incrementi prestazionali riuscendo a recuperare i tempi morti (es. caricamento dei dati dalla memoria) e sfruttarli per lâ€™esecuzione di altre operazioni: lâ€™incremento di un 10% dellâ€™elettronica puÃ² portare ad incrementi delle prestazioni fino al 50% contrariamente al raddoppio della circuiteria necessaria per un approccio CMP su due core.

AMD Bulldozer e Bobcat - Anteprima architettura 1. Bulldozer - Parte 1 2

AMD ha scelto un approccio ibrido, includendo in ogni modulo Bulldozer due core, ma condividendo tra i due alcune unitÃ di elaborazione e tutta la logica di gestione e controllo. Questo approccio porta ad una drastica riduzione del numero di circuiti necessari per un approccio CMP, senza perÃ² aver gli svantaggi della schedulazione introdotta dal SMT. I componenti condivisi in Bulldozer sono i circuiti dedicati al Fetch e Decodifica delle istruzioni che sono stati migliorati ed ampliati rispetto al passato, passando da un decoder a 4 vie in grado di fondere branch di istruzioni x86 e aumentare cosÃ¬ lâ€™efficienza complessiva; un simile approccio Ã¨ giÃ stato proposto da Intel nelle CPU Nehalem.

AMD Bulldozer e Bobcat - Anteprima architettura 1. Bulldozer - Parte 1 3

Un altro componente condiviso tra i due â€œcoreâ€ Ã¨ lâ€™unitÃ per lâ€™elaborazione Floating Point: AMD ha infatti messo in evidenza, come circa 80% delle elaborazioni comuni siano basate solo su interi ed ha quindi deciso questo taglio rispetto al passato. Seppur vero che in ambito consumer e lavorativo la maggior parte dellâ€™elaborazione riguarda proprio gli interi, in ambito High Performance Computing e Server, si ha sempre una maggior richiesta di potenza di calcolo in Floating Point, basti ricordare che NVIDIA ha dovuto modificare la sua GPU G80 al fine di supportare completamente le specifiche per il calcolo a doppia precisione richieste per lâ€™elaborazione con la tecnologia CUDA in ambito scientifico. AMD ha comunque una risposta a questa obiezione citando le nascenti tecnologie di calcolo parallelo basate sulle GPU e lâ€™introduzione di OpenCL, linguaggio da sempre sostenuto dalla casa di Sunnyvale e supportato dalle schede video Radeon e FireGL.

Solo con il lancio effettivo sul mercato di queste soluzioni, potremmo dare un giudizio su questa scelta progettuale.

AMD Bulldozer e Bobcat - Anteprima architettura 1. Bulldozer - Parte 1 4

La pipeline di Bulldozer Ã¨ stata allungata e questo ha reso necessario lâ€™introduzione di tecniche di prefetch piÃ¹ evolute al fine evitare interruzioni durante lâ€™esecuzione delle istruzioni; collo di bottiglia di questa scelta Ã¨ il controller di memoria, su cui perÃ² non sono ancora stati alzati i veli, lasciando trapelare solo indiscrezioni su una versione ottimizzata dell'attuale controller DDR3. Ãˆ presumibile che sarÃ mantenuto un approccio ad un controller a due canali per il mercato consumer e fino a quattro per la versione server.

Ogni unitÃ di elaborazione (2 integer e 1 floating point) Ã¨ dotata di uno scheduler dedicato e per quanto riguarda le unitÃ intere di una cache di primo livello da 16k e di una unitÃ DTLB a 32 vie associativa.

La cache di secondo livello Ã¨ unificata a livello di modulo Bulldozer ed Ã¨ condivisa per le tre unitÃ di elaborazione incluse.

username
password		ricordami
password dimenticata?		registrati

AMD Bulldozer e Bobcat - Anteprima architettura

Due nuove architetture x86 da AMD

Seguici

Supporto Tecnico Ufficiale

Antec

Microcool

Cooler Master

Top del mese

Nexthardware

Seguici

Servizi & info