Italia

RoCE: RDMA su Converged Ethernet per Prestazioni di Rete ad Alta Efficienza

Updated on set 14, 2022
3.4k

Nell'era dei dati, i requisiti per una rete più veloce, efficiente e scalabile non sono mai stati ridotti. Poiché le tradizionali connessioni Ethernet TCP/IP sono sensibili alla CPU e richiedono un'ulteriore elaborazione e copia dei dati, non sono più in grado di soddisfare le attuali esigenze di rete. In questo contesto, arriva RDMA over Converged Ethernet (RoCE). Per capire cos'è RoCE, vale la pena di esaminare prima RDMA.

Che cos'è RDMA?

L'accesso diretto remoto alla memoria (RDMA) è una tecnologia che consente l'accesso diretto dalla memoria di un host o di un server alla memoria di un altro host o server senza coinvolgere la CPU. In questo modo, le CPU sono libere di svolgere il lavoro a cui sono destinate, come l'esecuzione di applicazioni e l'elaborazione di enormi quantità di dati. In questo modo, è possibile ottenere prestazioni di rete e host con una latenza inferiore, un carico di CPU inferiore e una larghezza di banda superiore a costi contenuti.RDMA Technology

Figura 1: Tecnologia RDMA

 

Che cos'è RoCE?

Come tipo di RDMA, RoCE è un protocollo di rete definito nello standard InfiniBand Trade Association (IBTA), che consente l'RDMA sulla rete Ethernet convergente. In breve, può essere considerato come l'applicazione della tecnologia RDMA nei data center iperconvergenti, nel cloud, nello storage e negli ambienti virtualizzati. Possiede tutti i vantaggi della tecnologia RDMA e la familiarità di Ethernet. Per capire le differenze tra RoCE e Infiniband, potete leggere questo articolo RoCE vs Infiniband vs TCP/IP.

Tipi di RoCE

In generale, esistono due versioni di RDMA over Converged Ethernet: RoCE v1 e RoCE v2. Dipende dall'adattatore o dalla scheda di rete utilizzata.

  • RoCE v1: Il protocollo RoCE v1 è un protocollo di livello di collegamento Ethernet che consente a due host nello stesso dominio di trasmissione Ethernet (VLAN) di comunicare. Utilizza l'Ethertype 0x8915, che limita la lunghezza del frame a 1500 byte per un frame Ethernet standard e a 9000 byte per un frame Ethernet jumbo.

  • RoCE v2: Il protocollo RoCE v2 supera la limitazione della versione 1 che era limitata a un singolo dominio di trasmissione (VLAN). Modificando l'incapsulamento dei pacchetti in modo da includere le intestazioni IP e UDP, RoCE v2 può ora essere utilizzato su reti L2 e L3. Ciò consente il routing Layer 3, che porta RDMA su reti con più sottoreti per una grande scalabilità. Pertanto, RoCE v2 è anche considerato RoCE rotabile (RRoCE). Con l'arrivo di RoCE v2, è ora possibile anche il multicast IP.

Figura 2: Formato del pacchetto RoCE v1 vs RoCE v2

Vantaggi del RoCE

Poiché RDMA over Converged Ethernet ha accesso diretto ai dati della memoria tramite l'interfaccia di rete anziché attraverso il kernel, può consentire una trasmissione a bassa latenza e ad alte prestazioni.

  • Basso coinvolgimento della CPU: AAccesso alla memoria dello switch o del server remoto senza consumare cicli di CPU sul server remoto, il che consente di sfruttare appieno la larghezza di banda disponibile e una maggiore scalabilità.

  • Copia zero: Inviare e ricevere dati da e verso buffer remoti.

  • Alta produttività: Poiché la latenza e il throughput sono stati migliorati da RoCE, le prestazioni della rete hanno guadagnato molto.

  • Risparmio di costi: Con RoCE non è necessario acquistare nuove apparecchiature o sostituire l'infrastruttura Ethernet per gestire l'enorme quantità di dati, con un notevole risparmio sulle spese di capitale delle aziende.

Figura 3: Prima Vs. Dopo RoCE

 

Come realizzare la RoCE?

In generale, per realizzare RDMA su Ethernet convergente per un data center, è possibile installare i driver delle schede o degli adattatori di rete che supportano RoCE. Tutte le NIC Ethernet richiedono schede di rete RoCE. I driver RoCE sono disponibili in Red Hat, Linux, Microsoft Windows e altri sistemi operativi comuni. RDMA su Ethernet convergente è disponibile in due modi. Per switch di rete, è possibile scegliere di utilizzare lo switch con un sistema operativo che supporta il PFC (priority flow control). Per quanto riguarda un rack server o host, è necessario utilizzare una scheda di rete, come ConnectX-3 pro e ConnectX-4 e successive.

 

Domande frequenti su RoCE

Di seguito elenchiamo alcune domande frequenti su RDMA over converged Ethernet per una migliore comprensione del tema.

1. Quali switch o schede/adattatori di rete FS supportano RoCE?

Finora, gli switch della serie FS N con Cumulus OS e la serie S58/80 possono tutti supportare RoCE v1 e v2. I clienti devono abilitare la funzione PFC dopo aver acquistato uno switch RDMA. Per quanto riguarda gli adattatori e le schede, il RoCE non è ancora accessibile in FS.

2. Gli adattatori RoCE possono comunicare con altri tipi di adattatore, come iWARP?

Gli adattatori RoCE possono comunicare solo con altri adattatori RDMA over converged Ethernet. Qualsiasi configurazione che tenti di mescolare i tipi di adattatore, ad esempio adattatori RoCE combinati con adattatori iWARP, probabilmente tornerà alle connessioni TCP/IP tradizionali.

3. Qual è la differenza tra RoCE e iWARP?

Come il protocollo di rete RoCE, anche iWARP (Internet wide area RDMA protocol) supporta la funzione RDMA con una latenza inferiore, ma presenta alcune differenze.

Da un lato, RoCE è l'unica soluzione RDMA basata su Ethernet standard del settore, con un ecosistema multivendor che fornisce adattatori di rete e opera su switch Ethernet standard di livello 2 e 3. Dall'altro, iWARP ha ricevuto solo un supporto minimo. E iWARP ha ricevuto solo un supporto minimo.

D'altra parte, iWARP utilizza un complesso mix di livelli, tra cui DDP (Direct Data Placement), una modifica nota come MPA (Marker PDU Aligned framing) e un protocollo RDMA separato (RDMAP) per fornire servizi RDMA su TCP/IP. Con un'architettura così complessa, sarà difficile per il protocollo iWARP applicare RDMA ai framework di trasporto software esistenti. Dopo questo compromesso, il throughput, la latenza e l'utilizzo della CPU per iWARP saranno ridotti.

Figura 4: Livelli di rete complessi di iWARP rispetto al modello più semplice di RoCE

 

Conclusione

Eseguendo RDMA nei data center, è possibile ottenere l'offloading del movimento dei dati e una maggiore disponibilità di risorse CPU per l'applicazione. Chi adotta RoCE può beneficiare delle funzionalità di RDMA senza modificare la propria infrastruttura di rete. Riducendo la latenza della rete Ethernet e scaricando l'overhead della CPU, RoCE aumenta le prestazioni delle applicazioni di ricerca, archiviazione, database, finanziarie e ad alto tasso di transazioni. Aumentando l'efficienza della CPU e migliorando le prestazioni delle applicazioni, RoCE può ridurre il numero di server necessari, producendo così un risparmio energetico e riducendo l'ingombro dei data center basati su Ethernet.

13

Potresti essere interessato a