Deutsch

RoCE: RDMA over Converged Ethernet für hocheffiziente Netzwerkleistung

Updated on Jul 8, 2022
739

Rechenzentrum-Switches

Im Zeitalter der Datenübertragung sind die Anforderungen an ein schnelleres, effizienteres und skalierbares Netzwerk nie geringer geworden. Da die herkömmlichen TCP/IP-Ethernet-Verbindungen CPU-intensiv sind und eine zusätzliche Verarbeitung und Vervielfältigung der Daten erfordern, können sie den aktuellen Netzwerkanforderungen nicht mehr gerecht werden. In diesem Zusammenhang kommt RDMA over Converged Ethernet (RoCE) ins Spiel. Um herauszufinden, was RoCE ist, lohnt es sich, zunächst einen Blick auf RDMA zu werfen.

Was ist RDMA?

Remote Direct Memory Access (RDMA) ist eine Technologie, die den direkten Speicherzugriff vom Speicher eines Hosts oder Servers auf den Speicher eines anderen Hosts oder Servers ermöglicht, ohne dass die CPU beteiligt ist. Dadurch werden die CPUs entlastet, damit sie ihre eigentliche Arbeit verrichten können, z. B. die Ausführung von Anwendungen und die Verarbeitung großer Datenmengen. Auf diese Weise kann die Netzwerk- und Hostleistung mit geringerer Latenz, geringerer CPU-Belastung und höherer Bandbreite kosteneffizient erreicht werden.RDMA-Technologie

Abbildung 1: RDMA-Technologie

 

Was ist RoCE?

Als eine Art von RDMA ist RoCE ein im Standard der InfiniBand Trade Association (IBTA) definiertes Netzwerkprotokoll, das RDMA über ein konvergiertes Ethernet-Netzwerk ermöglicht. Kurz gesagt, kann es als Anwendung der RDMA-Technologie in hyperkonvergenten Rechenzentren, Cloud-, Speicher- und virtualisierten Umgebungen betrachtet werden. Sie bietet alle Vorteile der RDMA-Technologie und die Vertrautheit von Ethernet. Um die Unterschiede zwischen RoCE und Infiniband zu verstehen, können Sie diesen Artikel RoCE vs Infiniband vs TCP/IP lesen.

Typen von RoCE

Im Allgemeinen gibt es zwei RoCE-Versionen: RoCE v1 und RoCE v2, je nach verwendetem Netzwerkadapter oder -karte.

  • RoCE v1: Das RoCE v1-Protokoll ist ein Ethernet-Link-Layer-Protokoll, das es zwei Hosts in derselben Ethernet-Broadcast-Domäne (VLAN) ermöglicht, miteinander zu kommunizieren. Es verwendet den Ethertype 0x8915, der die Rahmenlänge auf 1500 Byte für einen Standard-Ethernet-Rahmen und 9000 Byte für einen Ethernet-Jumbo-Rahmen begrenzt.

  • RoCE v2: Das RoCE v2-Protokoll überwindet die Beschränkung der Version 1, die auf eine einzige Broadcast-Domäne (VLAN) begrenzt ist. Durch die Änderung der Paketkapselung, die IP- und UDP-Header enthält, kann RoCE v2 nun sowohl in L2- als auch in L3-Netzwerken eingesetzt werden. Dies ermöglicht Layer-3-Routing, wodurch RDMA in Netzwerken mit mehreren Subnetzen eingesetzt werden kann und eine hohe Skalierbarkeit gewährleistet. Daher wird RoCE v2 auch als Routable RoCE (RRoCE) bezeichnet. Dank der Einführung von RoCE v2 ist nun auch IP-Multicast möglich.

    RoCE: RDMA over Converged Ethernet für hocheffiziente Netzwerkleistung

Abbildung 2: RoCE v1 vs. RoCE v2 Paket Format

Vorteile von RoCE

Da RDMA over Converged Ethernet über die Netzwerkschnittstelle und nicht über den Kernel direkt auf die Speicherdaten zugreift, kann es eine Übertragung mit geringer Latenz und hoher Leistung ermöglichen.

  • Geringe CPU-Belastung: Zugriff auf den Speicher des entfernten Switches oder Servers, ohne CPU-Zyklen auf dem entfernten Server zu verbrauchen, was die volle Nutzung der verfügbaren Bandbreite und eine höhere Skalierbarkeit ermöglicht.

  • Null-Kopie: Senden und Empfangen von Daten zu und von entfernten Puffern. - Hochproduktiv: Da die Latenzzeit und der Durchsatz durch RoCE verbessert wurden, hat die Netzwerkleistung stark zugenommen.

  • Hochproduktiv: Da die Latenzzeit und der Durchsatz durch RoCE verbessert wurden, hat die Netzwerkleistung stark zugenommen.

  • Kostensparend: Mit RoCE ist es nicht erforderlich, neue Geräte zu kaufen oder die Ethernet-Infrastruktur zu ersetzen, um die enormen Datenmengen zu bewältigen, was den Unternehmen erhebliche Investitionseinsparungen ermöglicht.

Vor vs. Nach RoCE

Abbildung 3: Vor vs. Nach RoCE

Wie kann RoCE realisiert werden?

Um RDMA über konvergiertes Ethernet für ein Rechenzentrum zu realisieren, können Sie Netzwerkadapter oder -kartentreiber installieren, die RoCE unterstützen. Alle Ethernet-NICs erfordern RoCE-Netzwerkadapterkarten. RoCE-Treiber sind in Red Hat, Linux, Microsoft Windows und anderen gängigen Betriebssystemen verfügbar. RDMA über konvergiertes Ethernet ist auf zwei Arten verfügbar. Bei Netzwerk-Switches können Sie den Switch mit einem Betriebssystem verwenden, das PFC (Priority Flow Control) unterstützt. Für einen Rack-Server oder Host müssen Sie eine Netzwerkadapterkarte wie ConnectX-3 pro und ConnectX-4 und höher verwenden.

RoCE

FAQs über RoCE

Hier finden Sie eine Liste mit häufig gestellten Fragen zu RoCE, damit Sie es besser verstehen.

1. Welche FS-Switches oder Netzwerkkarten/-adapter unterstützen RoCE?

Bisher unterstützen die Switches der FS N-Serie mit Cumulus OS und die S58/80-Serie RoCE v1 und v2. Kunden müssen ihre PFC-Funktion nach dem Kauf eines RDMA-Switches aktivieren. Was die Adapter und Karten betrifft, so ist RoCE in FS noch nicht verfügbar.

2. Können RoCE-Adapter mit anderen Adaptertypen, wie iWARP, kommunizieren?

RoCE-Adapter können nur mit anderen RDMA over Converged Ethernet-Adaptern kommunizieren. Alle Konfigurationen, die versuchen, Adaptertypen zu mischen, z. B. RoCE-Adapter in Kombination mit iWARP-Adaptern, werden wahrscheinlich auf traditionelle TCP/IP-Verbindungen zurückgreifen.

3. Was ist der Unterschied zwischen RoCE und iWARP?

Wie das RoCE-Netzwerkprotokoll unterstützt auch iWARP (Internet wide area RDMA protocol) die RDMA-Funktion mit geringerer Latenz, aber es gibt einige Unterschiede.

Einerseits ist RoCE die einzige Ethernet-basierte RDMA-Lösung nach Industriestandard mit einem Ökosystem aus mehreren Anbietern, die Netzwerkadapter bereitstellen und über standardmäßige Layer-2- und Layer-3-Ethernet-Switches arbeiten. Und iWARP hat nur minimale Unterstützung erfahren.

Andererseits verwendet iWARP eine komplexe Mischung von Schichten, einschließlich DDP (Direct Data Placement), eine als MPA (Marker PDU Aligned framing) bekannte Optimierung und ein separates RDMA-Protokoll (RDMAP), um RDMA-Dienste über TCP/IP bereitzustellen. Bei einer derart komplexen Architektur wird es für das iWARP-Protokoll schwierig sein, RDMA auf die bestehenden Software-Transport-Frameworks anzuwenden. Nach einem solchen Kompromiss werden der Durchsatz, die Latenz und die CPU-Auslastung für iWARP gedämpft.

Abbildung 4: Komplexe Netzwerkschichten von iWARP vs. einfacheres Modell von RoCE

 

Fazit

Durch den Einsatz von RDMA in Rechenzentren können Datenbewegungen ausgelagert und eine höhere Verfügbarkeit von CPU-Ressourcen für die Anwendung erreicht werden. Wer RoCE einsetzt, kann von den RDMA-Funktionen profitieren, ohne seine Netzwerkinfrastruktur zu ändern. Durch die Verringerung der Ethernet-Netzwerklatenz und die Auslagerung des CPU-Overheads steigert RoCE die Leistung von Such-, Speicher-, Datenbank-, Finanz- und Anwendungen mit hoher Transaktionsrate. Durch die Erhöhung der CPU-Effizienz und die Verbesserung der Anwendungsleistung kann RoCE die Anzahl der benötigten Server reduzieren, was zu Energieeinsparungen führt und den Platzbedarf von Ethernet-basierten Rechenzentren verringert.

11

Das könnte Sie auch interessieren