Introduzione
Dopo aver analizzato, con questo articolo, quali siano le principali caratteristiche architetturali introdotte da Intel con i nuovi processori Xeon 5500, è il momento di passare ad un'analisi prestazionale delle potenzialità che queste nuove cpu mettono a disposizione.
L'obiettivo che ci poniamo in questo articolo è duplice: da un lato evidenziare, a parità di frequenza di clock, quali siano i benefici prestazionali di basso livello introdotti dalle cpu Xeon 5500 grazie alle novità architetturali implementate da Intel. Dall'altro, confrontare con alcune applicazioni in ambito workstation quale sia l'effettivo beneficio, in termini di minori tempi di esecuzione, dato dal passaggio alla nuova architettura Nehalem rispetto a quella Penryn della precedente generazione di cpu Intel Xeon.
Il confronto è stato eseguito utilizzando due workstation grafiche identiche, fatta ovviamente eccezione per i processori, la scheda madre e la memoria. Da un lato troviamo processori Intel Xeon X5482, architettura Penryn con frequenza di clock di 3,2 GHz e 8 core logici messi a disposizione dalle due cpu. Dall'altro processori Intel Xeon W5580, basati sulla nuova architettura Nehalem con frequenza di clock sempre di 3,2 GHz e dotati di tecnologia Hyper-Threading per un totale di 16 core logici per un sistema con due socket.
Questi i componenti utilizzati nei test:
* scheda madre Supermicro X8DA3, chipset Intel 5520 (2 Socket 1366 LGA)
* scheda madre Supermicro X7DWA, chipset 5400B (2 Socket 771 LGA)
* scheda video: NVIDIA Quadro FX 1700
* memoria DDR3-1333 con timings 9-9-9-24 1T, quantitativo di 12 Gbytes (6 moduli da 2 Gbytes ciascuno)
* memoria Fully Buffered DDR-800 con timings 5-5-5-18, quantitativo di 16 Gbytes (4 moduli da 4 Gbytes ciascuno)
* hard disk: Western Digital Velociraptor 300 Gbytes, 10.000 rpm da 2 pollici e 1/2
* sistema operativo: Mirosoft Windows Server 2008 Enterprise italiano

Intel Xeon W5580: clock 3,2 GHz, cache L2 da 4x512 Kbytes e L3 da 8 Mbytes; Hyper-Threading e Turbo Mode attivi

Intel Xeon X5482: clock 3,2 GHz, cache L2 da 2x6 Mbytes; Hyper-Threading e Turbo Mode non disponibili

memoria DDR3-1333 per il processore Intel Xeon W5580; timings 9-9-9-24 1T

memoria Fully Buffered DDR2-800 per il processore Intel Xeon X5482; timings pari a 5-5-5-18
I due sistemi utilizzano differenti quantitativi di memoria RAM; quello Xeon X5482 è abbinato a 16 Gbytes di memoria DDR2-800 Fully Buffered Dimm, mentre per la piattaforma Xeon W5580 sono stati utilizzati 12 Gbytes di memoria DDR3-1333. Questa differenza è dettata dalla necessità di utilizzare per ogni processore Xeon W5580 un numero di moduli memoria pari a 3 o multiplo di questa cifra, così da abilitare la configurazione triple channel per il memory controller ottenendo la più elevata bandwidth possibile.
Il sistema di test
E4Company, azienda italiana specializzata nella produzione di sistemi workstation e server, ci ha messo a disposizione i due sistemi utilizzati in questa analisi prestazionale. Come segnalato, si tratta di workstation identiche per componentistica interna fatta eccezione per scheda madre, processori e tipologia di memoria Ram.

Entrambi i sistemi sono montati in uno chassis prodotto da Supermicro, azienda che ha fornito anche le due schede madri; la struttura è quella di un tradizionale chassis tower ma è possibile ruotare orizzontalmente i sistemi e adattarli al montaggio in un armadio rack con un ingombro di 4 unità, provvedendo ovviamente a dotarsi delle apposite staffe di sostegno. L'espandibilità è assicurata dalla presenza di 2 slot da 5 pollici e 1/4 per unità ottiche e di storage, mentre dal versante hard disk è presente un backplane SAS da 8 unità.

La parte superiore della scheda madre Supermicro è dominata dai due Socket 1366 LGA per i processori Xeon W5580: si tratta dello stesso tipo di interfaccia di collegamento utilizzata da Intel per i processori Core i7, la prima famiglia di cpu basata su architettura Nehalem ad aver debuttato sul mercato. Accanto ad ogni processore trovano posto 6 slot per moduli memoria DDR3: ogni processore è dotato di memory controller integrato ed è quindi abbinato ai propri moduli.
Le migliori prestazioni velocistiche vengono ottenute, con questa piattaforma, abbinando a ciascun processore almeno 3 moduli memoria: così facendo viene abilitata la modalità triple channel per la massima bandwidth teorica. Nel sistema E4 sono stati utilizzati 3 moduli per ogni processore, ottenendo una bandwidth massima teorica cumulata tra i due memory controller pari a circa 52 Gbytes al secondo. La parte inferiore della scheda madre raccoglie gli slot PCI Express, due del tipo 16x e uno 4x, affiancati da 3 slot PCI tradizionali. Il north bridge del chipset Intel 5520 è sormontato da una ventola di raffreddamento, mentre nella parte inferiore si distingue chiaramente il south bridge ICH10, dal quale dipendono 6 canali SATA.

Il secondo sistema, basato su processore Intel Xeon X5482, vede gli stessi componenti della precedente piattaforma fatta ovviamente eccezione per processore, memoria e scheda madre. Cambia la disposizione dei componenti: troviamo in questo caso 8 slot memoria per moduli Fully Buffered DDR2, dei quali la metà è occupata da moduli con capacità complessiva di 4 Gbytes ciascuno. Nella metà inferiore della scheda madre spiccano i 2 slot PCI Express 16x, 2 PCI tradizionali e 2 PCI a 64bit. La dissipazione dei componenti del chipset è assicurata da dissipatori passivi; evidenziamo il guscio plastico montato sopra i moduli memoria così che il calore generato dai moduli FB-Dimm possa venir più facilmente spinto all'esterno dello chassis dalla ventola di aspirazione montata posteriormente.

Lo storage è assicurato da un singolo hard disk Western Digital Velociraptor, meccanica da 2,5 pollici di diametro e da 300 Gbytes di capacità che è, con una velocità di rotazione dei piatti di 10.000 giri al minuto, rappresenta la più veloce proposta di storage per un impiego domestico o in workstation senza dover passare a meccaniche SAS enterprise da 15.000 giri al minuto o alle nuove proposte solid state disk.

Per il sottosistema video la scelta è caduta su una proposta PNY con GPU NVIDIA della famiglia Quadro, modello FX 1700. La scheda è dotata di chip video con 32 stream processors, con clock di 460 MHz per la GPU e di 920 MHz per gli stream processors; i 512 Mbytes di memoria video DDR2 hanno frequenza di clock effettiva di 800 MHz. Si tratta di specifiche lontane dalle più veloci proposte di NVIDIA per il segmento desktop top di gamma, oltre che di alcuni modelli di schede Quadro, ma più che adatte ad una workstation che verrà utilizzata principalmente per elaborazioni poco dipendenti dal sottosistema video.
Memoria ed efficienza multicore
Iniziamo l'analisi con alcuni test di basso livello incentrati sulla memoria, così da meglio evidenziare quali siano i benefici introdotti da Intel nelle cpu Xeon 5500 grazie all'utilizzo del memory controller integrato, oltre che della configurazione triple channel per le memorie DDR3. In tutte le analisi abbiamo inserito, per il processore Xeon W5580, rilevazioni sia con tecnologia HyperThreading abilitata sia disabilitandola, così da meglio evidenziare se il suo utilizzo possa portare a qualche limitazione di sorta.


I risultati ottenuti con Everest Ultimate e Sandra 2009 evidenziano i benefici introdotti da Intel con il memory controller integrato: il processore Xeon X5500 registra valori di bandwidth sensibilmente superiori a quelli del modello Xeon X5482, beneficiando in questo sia della superiore frequenza di clock della memoria (1.333 MHz contro 800 MHz) sia dell'architettura triple channel.


In calo anche la latenza di accesso della memoria, nuovamente grazie all'integrazione del memory controller. I risultati ottenuti sono vicini a quelli di sistemi dotati di processore Intel Core i7 965 ma leggermente superiori, in quanto la memoria utilizzata è di tipo ECC Registered. Evidenziamo inoltre come abilitando la tecnologia Hyper-Threading i risultati di questi test sintetici tendano a restare pressoché invariati; solo con Everest si registrano differenze di un certo rilievo nell'analisi della bandwidth della memoria, ma c'è anche da evidenziare come con questo test la bandwidth della memoria in scrittura misurata con i sistemi Xeon W5580 sia inferiore a quella della soluzione Xeon X5482.



Sandra integra al proprio interno alcuni interessanti test che valutano l'efficienza di architetture multicore. Nell'analisi dei risultati poniamo l'attenzione sul sistema Xeon W5580 con tecnologia Hyper-Threading disabilitata a confronto con il sistema dotato di processori Xeon X5482, in quanto i valori ottenuti dal primo con HT abilitato sembrano essere più il risultato di trasferimenti tra core dello stesso di più che tra processori su Socket differenti.
E' evidente come il sistema con processori della famiglia Nehalem riesca a far registrare valori di latenza nettamente inferiori rispetto a quello con cpu della famiglia Penryn, mantenendo una bandwidth tra i socket che è mediamente più elevata benché quella del sistema con processori Xeon X5482 riesca ad essere maggiore con alcuni pacchetti di dati trasferiti.
Si può quindi sintetizzare questa analisi evidenziando come il memory controller integrato e la tecnologia QuickPath Interconnect riescano a far ottenere tangibili incrementi velocistici all'intera piattaforma Xeon 5500 rispetto a quella di precedente generazione.
continua....
