NVIDIA Tesla? Non più: ora NVIDIA vGPU!

Data
20 Gen 2021
Categoria
Articoli
Contattaci
NVIDIA Tesla? Non più: ora NVIDIA vGPU!

Come è avvenuta la transizione dall’acquisto di una scheda grafica a una soluzione completa come NVIDIA vGPU per soddisfare le esigenze sempre più complesse all’interno di un datacenter?

Tale articolo è da intendersi come prosieguo della tematica affrontata in un altro testo, presente sul nostro sito, datato 2017. Tuttavia, a differenza di esso, descrive la transizione che si è evoluta nell’ambiente datacenter delle schede grafiche a seguito di richieste sempre più complesse e articolate con carichi di lavoro che, fino a qualche anno fa, rappresentavano qualcosa di inimmaginabile.

La tecnologia vGPU è nata nel 2015 e ha avuto un processo di maturazione di oltre 6 anni, attraverso 12 major release e relative minor.

Cosa significa abilitare la tecnologia NVIDIA vGPU all’interno del nostro datacenter?

Significa mettere a disposizione degli utenti finali una “porzione” della scheda NVIDIA con una allocazione statica della memoria (NB: profili grafici) con tagli differenziati da un minimo di 1gb a un massimo di 48gb e una componente computazionale rappresentata dal processore grafico condiviso a turno con la tecnologia proprietaria denominata “time slicing”.

La tecnologia vGPU è trasversale e compatibile con tutte le schede grafiche che sono state rese disponibili nel corso degli anni da NVIDIA a partire dalla famiglia KEPLER fino all’ultima release denominata AMPERE.

La tecnologia NVIDIA vGPU, come tale, è una abbinata HW+SW che si è evoluta anche a livello di nomenclatura e, mediante l’ultima release (datata febbraio 2021) c’è stato anche un cambio di nome come possiamo vedere nella tabella riportata qui a sinistra che evidenzia i nuovi nomi adottati.

In particolare, possiamo notare come esistano principalmente quattro versioni di questo prodotto. Questo è il vero punto di partenza: non la scheda grafica in sè, in quanto è la componente software che fa da abilitatore su quella hardware.

Il primo step è rappresentato dalla soluzione NVIDIA virtual PC mediante la quale, con un profilo grafico di 1gb o 2gb di memoria video dedicata, viene garantita un’accelerazione della grafica 3d di fascia enterprise per i nostri virtual desktop.
Allo stesso modo anche la componente NVIDIA virtual App accelera questa volta le applicazioni distribuite tramite server RDS.
Il top di gamma è rappresentato dalla soluzione NVIDIA RTX Virtual Workstation dedicata a chi utilizza software CAD, CAM, Rendering o in generale grafica professionale e  che garantisce tutte le performance della famiglia RTX all’interno del nostro datacenter.
Infine l’ultima soluzione è rappresentata dalla NVIDIA virtual Computer Server. Questa è dedicata all’AI, machine learning e deep learning.

Questi quattro tipi di licenze vengono applicate a tutte le  schede grafiche disponibili sul mercato (NB il driver è unico) e ognuna delle schede mette in campo caratteristiche tecniche e performance differenti.

Facendo un esempio pratico: la performance che è in grado di garantire una scheda grafica come la M10, dedicata alla fascia di mercato virtual PC (vPC) e pensata per una elevata densità di utenti/server, è molto differente rispetto a una RTX8000 concepita per una bassa densità di utenti/server, ma con profili grafici a partire da 4gb ed esigenze tecniche estremamente complesse.

Di seguito un riassunto delle schede disponibili.

Le due novità NVIDIA vGPU appena rilasciate sul mercato: NVIDIA A40 e NVIDIA A100

Due schede con una target di utilizzo estremamente differente, così come è differente anche la loro collocazione sul mercato.

Entrambe condividono tuttavia una caratteristica tecnica ben precisa facendo parte della nuova famiglia Ampere, ovvero l’introduzione della tecnologia SR-IOV per l’esposizione delle risorse computazionali.
Ad oggi, per poter essere utilizzate correttamente, richiedono lato hypervisor l’ultima versione di ESXI 7u2 (rilasciata a marzo 2021) o una configurazione bare metal (ma in questo caso si perdono parte dei vantaggi della tecnologia vGPU).

vGPU 12.0 on ESXi 6.7 needs Patch level ESXi670-202011002 (Build: 17167734) or higher

La A40 rappresenta il massimo delle performance disponibili sul mercato per quanto riguarda la virtualizzazione delle workstation o applicazioni grafiche, con l’ultima versione di ray tracing, innovative features di AI, shading avanzati e notevoli ottimizzazioni per carichi di lavoro deep learning.

E’ dotata di 48gb di memoria onboard e può essere collegata tramite NVLINK a una seconda scheda per raddoppiarne la memoria.
La differenza di performance rispetto alla precedente generazione di schede RTX è incredibile.

(NB il limite massimo di utenti/scheda con un profilo da 1gb è pari a 32 utenti. Non è possibile utilizzare tutti e 48 i gb di memoria in quanto si andrebbe incontro a problemi di scheduling/time slicing sulla GPU)

 

La A100  rappresenta la scheda che va a sostituire i modelli V100 e V100s. Oltre a migliori performance, garantite da caratteristiche tecniche estremamente superiori, introduce la nuova tecnologia MIG (multi instance GPU) per la virtualizzazione delle risorse GPU.

Questo tipo di tecnologia rappresenta la vera chiave di svolta in questo tipo di soluzioni e permette un reale isolamento tra un’istanza di vm e l’altra.

Per maggiori informazioni fate pure riferimento a questo articolo del nostro Solution Architect Adam Strizzolo, member of the 25 Virtual GPU Comunity Advisory Program.

“I due modelli di GPU appena visti, accompagnano l’introduzione di una nuova serie di features che riguardano la tecnologia vGPU ma soprattutto la disponibilità della tecnologia MIG su VMWARE.
Rispetto a quanto visto finora, la soluzione MIG sarà il vero spartiacque tecnologico nella virtualizzazione delle schede grafiche in ambito datacenter, garantendo a tutti gli utilizzatori performance estreme e costanti a prescindere dal carico di lavoro.
SI prepara una rivoluzione simile a quella del 2015 quando è stata introdotta la vGPU? Solo il tempo ce lo farà capire.”

 

Vuoi saperne di più?

Siamo a tua disposizione

    Cliccando su “Contattaci” acconsenti al trattamento dei tuoi dati personali in merito all'informativa sulla privacy.

    oppure puoi chiamarci al numero +39 0432 889787