Français

Guide Détaillé du Réseau RoCE v2

Publié le 20 déc, 2023 by
158

Dans le domaine en constante évolution des technologies de réseau, l'accès direct à la mémoire à distance (RDMA) s'est imposé comme un élément essentiel, simplifiant les processus de transfert de données et améliorant l'efficacité globale du réseau. L'une des principales technologies RDMA est RoCE (RDMA over Converged Ethernet), dont la deuxième version, RoCE v2, a fait des progrès considérables en termes de performances et de polyvalence. Cet article décrit les complexités de RoCE v2, en explorant sa technologie, ses cartes réseau et sa comparaison avec InfiniBand.

Qu'est-ce que RoCE v2 ?

RoCE v2 est un protocole RDMA conçu pour faciliter les transferts de données à faible latence et à haut débit sur les réseaux Ethernet. Contrairement aux méthodes traditionnelles de transfert de données qui impliquent plusieurs couches de traitement, RoCE v2 permet un accès direct à la mémoire entre les systèmes, minimisant ainsi l'implication de l'unité centrale et réduisant le temps de latence. RoCE v2 est donc particulièrement avantageux dans les scénarios exigeant une communication rapide et efficace des données, tels que les environnements de calcul à haute performance (HPC), les centres de données et l'informatique en nuage (cloud computing).

Le protocole s'appuie sur les fondements de son prédécesseur, RoCE v1, en introduisant des améliorations qui répondent à certaines limitations et améliorent les performances globales. RoCE v2 utilise une infrastructure Ethernet convergente, permettant la coexistence du trafic Ethernet traditionnel et du trafic RDMA sur le même réseau. Cette convergence rationalise la gestion du réseau et élimine le besoin d'une structure RDMA séparée, ce qui rend RoCE v2 plus accessible et plus rentable.

RoCE v2 Network Infrastructure

Carte Réseau RoCE

Au cœur de l'écosystème RoCE v2 se trouve la carte réseau RoCE, une carte d'interface réseau (NIC) spécialisée conçue pour prendre en charge les opérations RDMA. Ces cartes, également connues sous le nom d'adaptateurs RoCE, sont essentielles pour permettre l'accès direct à la mémoire entre les systèmes. Les cartes réseau RoCE sont dotées des capacités matérielles nécessaires pour décharger le processeur des opérations RDMA, ce qui permet de réduire la latence et d'améliorer les performances globales du système.

RoCE Network Card

Le cœur des switchs haute performance réside dans les puces de transfert utilisées. Notamment, les puces de la série Tomahawk3 sont largement utilisées dans les switchs, avec une tendance croissante vers des switchs prenant en charge les puces plus récentes de la série Tomahawk4. Cette évolution souligne l'importance de ces puces, qui sont couramment utilisées sur le marché commercial actuel pour la transmission des données.

Tomahawk3 series chips

RoCE v2 vs. Infiniband

RoCE v2 (RDMA over Converged Ethernet version 2) et InfiniBand sont deux technologies conçues pour assurer une communication à grande vitesse et à faible latence dans les centres de données et les environnements informatiques à haute performance. Voici quelques différences essentielles entre ces deux technologies.

RoCE v2 vs. Infiniband

Couche Physique

  • RoCE v2 : S'appuie sur l'infrastructure Ethernet, ce qui permet la convergence du stockage et du trafic de données régulier sur le même réseau. Cela facilite également son intégration dans les centres de données existants.

  • InfiniBand : utilise une structure dédiée pour la communication, distincte de l'Ethernet. Il nécessite souvent un réseau InfiniBand spécialisé, qui peut nécessiter un câblage et des switchs distincts.

Pile de Protocole et Pile de Réseau

  • RoCE v2 : Utilise le protocole RDMA (Remote Direct Memory Access) sur Ethernet. Il s'intègre à la pile TCP/IP traditionnelle, ce qui permet une compatibilité avec les protocoles de réseau standard.

  • InfiniBand : possède sa propre pile de protocoles optimisée pour les communications à grande vitesse et à faible latence, ainsi que sa propre pile de réseau, pouvant nécessiter des pilotes et des configurations spécialisés.

Commutation

  • RoCE v2 : Peut fonctionner sur des switchs Ethernet standard avec des fonctions de pontage de centre de données (DCB) ou Data Center Bridging, prenant en charge l'Ethernet sans perte.

  • InfiniBand : Requiert des switchs InfiniBand spécialement conçus pour des communications à faible latence et à haut débit.

Congestion

RoCE v2:

  • Traitement de la Congestion : RoCE v2 s'appuie sur les fonctions Data Center Bridging (DCB) des switchs Ethernet pour gérer la congestion. DCB fournit un environnement Ethernet sans perte, empêchant la perte de paquets due à la congestion.

  • Contrôle de la Congestion : RoCE ne dispose pas de mécanismes intégrés de contrôle de la congestion. Il s'appuie sur l'infrastructure Ethernet sous-jacente pour gérer les encombrements.

InfiniBand:

  • Traitement de la Congestion : InfiniBand dispose d'un support natif pour la gestion de la congestion. Il utilise des mécanismes tels que le contrôle de flux basé sur le crédit pour prévenir la congestion et assurer une communication sans perte.

  • Contrôle de la Congestion : InfiniBand comprend des algorithmes de routage adaptatif et de contrôle de la congestion pour ajuster dynamiquement les itinéraires du trafic et prévenir la congestion dans le réseau.

Routage

RoCE v2:

  • Mécanisme de Routage : RoCE v2 s'appuie généralement sur les protocoles de routage Ethernet traditionnels tels que le protocole RIP (Routing Information Protocol) ou OSPF (Open Shortest Path First) pour les décisions de routage.

  • Topologie : RoCE est souvent utilisé dans des topologies Ethernet standard, et les décisions de routage sont influencées par l'infrastructure Ethernet sous-jacente.

InfiniBand:

  • Mécanisme de Routage : les mécanismes de routage d'InfiniBand sont optimisés pour des communications à faible latence et à haut débit. Il prend en charge plusieurs chemins pour la redondance et l'équilibrage de la charge.

  • Topologie : InfiniBand prend en charge une variété de topologies, y compris les configurations fat-tree, hypercube et multi-rail. Le choix de la topologie peut influencer les décisions de routage.

Le choix entre RoCE v2 et InfiniBand dépend de facteurs tels que l'infrastructure existante, les exigences de l'application et les besoins spécifiques de l'environnement. RoCE v2 permet une intégration plus transparente dans les réseaux Ethernet existants, tandis qu'InfiniBand peut être préféré dans les environnements informatiques à haute performance exigeant les plus hauts niveaux de performance et d'évolutivité.

L'UEC Propose un Nouveau Protocole de Transport

Ultra Ethernet Consortium (UEC) a été officiellement fondé le 19 juillet, avec pour objectif principal de dépasser les capacités actuelles de l'Ethernet. Les membres fondateurs sont AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta et Microsoft. Ces entreprises apportent collectivement des décennies d'expertise en matière d'infrastructure réseau, de technologies en nuage et de déploiements informatiques à haute performance.

Le consortium soutient que l'accès direct à la mémoire à distance (RDMA), mis en place il y a plusieurs décennies, est devenu obsolète pour répondre aux exigences rigoureuses du trafic réseau ML. La tendance de RDMA à transférer des données en blocs de trafic importants peut entraîner des déséquilibres de liaison et des charges excessives. L'UEC préconise le lancement du développement d'un protocole de transport contemporain qui intègre RDMA pour les applications émergentes.

Résumé

RoCE v2 est un atout formidable dans le domaine des technologies RDMA, offrant une solution puissante aux organisations qui recherchent une communication de données à haute performance et à faible latence. Sa convergence sur l'infrastructure Ethernet, associée aux avancées apportées par le protocole de transport UEC, fait de RoCE v2 un choix polyvalent et rentable pour diverses applications, des environnements HPC à l'informatique en nuage.

Si les comparaisons avec InfiniBand mettent en évidence les points forts de RoCE v2, les entreprises doivent tenir compte de leurs besoins spécifiques et de leurs infrastructures existantes pour choisir la solution RDMA la plus adaptée. Alors que la technologie continue d'évoluer, RoCE v2 et les innovations qui y sont associées sont appelées à jouer un rôle central dans l'élaboration de l'avenir des réseaux à hautes performances.

Cela pourrait également vous intéresser

Connaissances
Connaissances
Connaissances
See profile for Migelle.
Migelle
Switch PoE, PoE+ ou PoE++ : Lequel choisir ?
25 août, 2021
47.5k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre LACP et PAGP ?
29 déc, 2021
16.9k
Connaissances
See profile for Migelle.
Migelle
Switch PoE actif ou passif : lequel choisir ?
28 févr, 2022
20.0k
Connaissances
See profile for Vincent.
Vincent
Comprendre le transceiver bidirectionnel BiDi
05 janv, 2022
9.4k
Connaissances
See profile for Moris.
Moris
Câbles à fibre optique Simplex ou Duplex
25 nov, 2018
17.8k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre RIP et OSPF ?
10 juin, 2021
23.0k