Italia

Una Guida Approfondita alla Rete RoCE v2

Aggiornato il 29 Dic 2023 by
196

Nel sempre mutante panorama delle tecnologie di rete, il Remote Direct Memory Access (RDMA) è emerso come un attore cruciale, semplificando i processi di trasferimento dati e migliorando l'efficienza complessiva della rete. Una tecnologia RDMA di rilievo è RoCE (RDMA over Converged Ethernet), con la sua seconda versione, RoCE v2, che compie progressi significativi in termini di prestazioni e versatilità. Questo articolo mette in luce le complessità di RoCE v2, esplorando la sua tecnologia, le schede di rete e confrontandolo con InfiniBand.

Cos'è RoCE v2?

RoCE v2 è un protocollo RDMA progettato per facilitare trasferimenti di dati ad alta latenza e alto throughput su reti Ethernet. A differenza dei metodi tradizionali di trasferimento dati che coinvolgono molteplici livelli di elaborazione, RoCE v2 consente un accesso diretto alla memoria tra i sistemi, riducendo al minimo il coinvolgimento della CPU e la latenza. Questo rende RoCE v2 particolarmente vantaggioso in scenari che richiedono comunicazioni dati veloci ed efficienti, come ambienti di calcolo ad alte prestazioni (HPC), data center e cloud computing.

Il protocollo si basa sulle fondamenta del suo predecessore, RoCE v1, introducendo miglioramenti che affrontano alcune limitazioni e migliorano le prestazioni complessive. RoCE v2 utilizza un'infrastruttura Ethernet convergente, consentendo la coesistenza del traffico Ethernet tradizionale con il traffico RDMA sulla stessa rete. Questa convergenza semplifica la gestione della rete ed elimina la necessità di una fabrica RDMA separata, rendendo RoCE v2 più accessibile ed economico.

RoCE v2 Network Infrastructure

Scheda di rete RoCE

Al centro dell'ecosistema RoCE v2 si trova la scheda di rete RoCE, una scheda di interfaccia di rete (NIC) specializzata progettata per supportare operazioni RDMA. Queste schede, anche conosciute come adattatori RoCE, sono fondamentali per abilitare l'accesso diretto alla memoria tra i sistemi. Le schede di rete RoCE sono dotate delle necessarie capacità hardware per scaricare le operazioni RDMA dalla CPU, risultando in una latenza inferiore e un miglioramento delle prestazioni complessive del sistema.

RoCE Network Card

Il nucleo degli switch ad alte prestazioni risiede nei chip di inoltro che impiegano. In particolare, i chip della serie Tomahawk3 sono ampiamente impiegati negli switch, con una tendenza crescente verso switch che supportano i nuovi chip della serie Tomahawk4. Questa transizione evidenzia l'importanza di questi chip, comunemente utilizzati nel mercato commerciale attuale per l'inoltro dei dati.

Tomahawk3 series chips

RoCE v2 vs. Infiniband

RoCE v2 (RDMA over Converged Ethernet version 2) e InfiniBand sono entrambe tecnologie progettate per fornire comunicazioni ad alta velocità e bassa latenza in data center e ambienti di calcolo ad alte prestazioni. Ecco alcune differenze chiave in vari aspetti.

RoCE v2 vs. Infiniband

Livello fisico

  • RoCE v2: RoCE v2 (RDMA over Converged Ethernet version 2) si basa sull'infrastruttura Ethernet, consentendo la convergenza del traffico di storage e del traffico dati regolare sulla stessa rete. Ciò facilita l'integrazione nelle configurazioni esistenti dei data center.

  • InfiniBand: Utilizza una fabric dedicata per la comunicazione, separata da Ethernet. Spesso richiede una rete InfiniBand specializzata, che potrebbe rendere necessaria l'installazione di cavi e switch separati.

Stack di protocollo e stack di rete

  • RoCE v2: Utilizza il protocollo RDMA (Remote Direct Memory Access) su Ethernet. Si integra con lo stack tradizionale TCP/IP, rendendolo compatibile con i protocolli di rete standard.

  • InfiniBand: Ha il proprio stack di protocolli ottimizzato per comunicazioni ad alta velocità e bassa latenza, e uno stack di rete che potrebbe richiedere driver e configurazioni specializzati.

Switching

  • RoCE v2: Può operare su switch Ethernet standard con funzionalità di Data Center Bridging (DCB), supportando Ethernet senza perdita di pacchetti.

  • InfiniBand: Richiede switch InfiniBand appositamente progettati per la comunicazione a bassa latenza e ad alto throughput.

Congestione

RoCE v2:

  • Gestione della congestione: RoCE v2 si basa sulle funzionalità di Data Center Bridging (DCB) degli switch Ethernet per gestire la congestione. DCB fornisce un ambiente Ethernet senza perdita, prevenendo la perdita di pacchetti dovuta alla congestione.

  • Controllo della congestione: RoCE stesso non dispone di meccanismi di controllo della congestione integrati. Invece, si basa sull'infrastruttura Ethernet sottostante per gestire la congestione.

InfiniBand:

  • Gestione della congestione: InfiniBand dispone di supporto nativo per la gestione della congestione. Utilizza meccanismi come il controllo del flusso basato su crediti per prevenire la congestione e garantire una comunicazione senza perdite.

  • Controllo della congestione: InfiniBand include algoritmi di routing adattativo e controllo della congestione per regolare dinamicamente le rotte del traffico e prevenire la congestione nella rete.

Routing

RoCE v2:

  • Meccanismo di routing: RoCE v2 di solito si affida a protocolli di routing Ethernet tradizionali come il Routing Information Protocol (RIP) o l'Open Shortest Path First (OSPF) per le decisioni di routing.

  • Topologia: RoCE è spesso utilizzato in topologie Ethernet standard, e le decisioni di routing sono influenzate dall'infrastruttura Ethernet sottostante.

InfiniBand:

  • Meccanismo di routing: InfiniBand ha i suoi meccanismi di routing ottimizzati per la comunicazione a bassa latenza e ad alto throughput. Supporta percorsi multipli per ridondanza e bilanciamento del carico.

  • Topologia: InfiniBand supporta una varietà di topologie, tra cui albero grasso (fat-tree), ipercubo (hypercube) e configurazioni multi-rail. La scelta della topologia può influenzare le decisioni di routing.

La scelta tra RoCE v2 e InfiniBand dipende da fattori come l'infrastruttura esistente, i requisiti delle applicazioni e le esigenze specifiche dell'ambiente. RoCE v2 offre un percorso di integrazione più agevole nelle reti Ethernet esistenti, mentre InfiniBand può essere preferito in ambienti di calcolo ad alte prestazioni che richiedono i massimi livelli di prestazioni e scalabilità.

UEC introduce un nuovo protocollo di trasporto

L'Ultra Ethernet Consortium(UEC) è stato formalmente fondato il 19 luglio, con l'obiettivo primario di superare le attuali capacità di Ethernet. I membri fondatori includono AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta e Microsoft. Queste aziende portano insieme decenni di esperienza nell'infrastruttura di rete, nell'intelligenza artificiale, nelle tecnologie cloud e nelle implementazioni di calcolo ad alte prestazioni.

Il consorzio sostiene che il Remote Direct Memory Access (RDMA), istituito molti anni fa, sia diventato obsoleto per le rigorose esigenze del traffico di rete AI/ML. La tendenza di RDMA a trasferire dati in blocchi di traffico considerevoli può causare squilibri nelle connessioni e oneri eccessivi. UEC propugna l'avvio dello sviluppo di un protocollo di trasporto contemporaneo che integri RDMA per le applicazioni emergenti.

Conclusioni

RoCE v2 si configura come una forza formidabile nel campo delle tecnologie RDMA, offrendo una potente soluzione per le organizzazioni alla ricerca di comunicazioni dati ad alte prestazioni e a bassa latenza. La sua convergenza su infrastruttura Ethernet, unita ai progressi introdotti dal protocollo di trasporto di UEC, posiziona RoCE v2 come una scelta versatile ed economica per diverse applicazioni, dagli ambienti HPC al cloud computing.

Sebbene i confronti con InfiniBand mettano in luce i punti di forza di RoCE v2, le organizzazioni devono considerare i loro requisiti specifici e le infrastrutture esistenti nella scelta della soluzione RDMA più adatta. Con l'evolversi della tecnologia, RoCE v2 e le sue innovazioni associate sono destinate a svolgere un ruolo centrale nella definizione del futuro delle reti ad alte prestazioni.

Potresti essere interessato a

Conoscenza
See profile for Sheldon.
Sheldon
Cosa è la porta SFP di uno switch Gigabit?
22 Mag 2023
83.8k
Conoscenza
Conoscenza
See profile for Migelle.
Migelle
Switch PoE, PoE+ e PoE++: Come scegliere?
16 Mar 2023
36.8k
Conoscenza
See profile for Sheldon.
Sheldon
LACP e PAGP: Qual è la differenza?
08 Mar 2023
25.1k
Conoscenza
Conoscenza
See profile for Moris.
Moris
DHCP o IP Statico: Qual è il migliore?
08 Mag 2023
55.7k
Conoscenza
See profile for Migelle.
Migelle
Switch Attivo vs Passivo: Quale Scegliere?
07 Dic 2020
20.4k
Conoscenza
See profile for Sheldon.
Sheldon
RIP vs OSPF: Qual è la differenza?
15 Nov 2022
28.6k
Conoscenza
See profile for Vincent.
Vincent
Capire il moduli BiDi
08 Mar 2021
19.9k
Conoscenza
See profile for Vincent.
Vincent
XFP vs SFP+: Quali sono le differenze?
10 Gen 2023
14.9k
Conoscenza