Español

Una guía detallada sobre la red RoCE v2

Actualizado el 20 de diciembre de 2023 por
248

En el panorama en constante evolución de las tecnologías de redes, el acceso remoto directo a la memoria (RDMA) se ha convertido en un actor crucial, que agiliza los procesos de transferencia de datos y mejora la eficiencia general de la red. Una tecnología RDMA destacada es RoCE (RDMA sobre Ethernet convergente), cuya segunda versión, RoCE v2, logra avances significativos en rendimiento y versatilidad. Este artículo destaca las complejidades de RoCE v2, explora su tecnología, tarjetas de red y la comparación con InfiniBand.

¿Qué es RoCE v2?

RoCE v2 es un protocolo RDMA diseñado para facilitar transferencias de datos de alto rendimiento y baja latencia a través de redes Ethernet. A diferencia de los métodos tradicionales de transferencia de datos que implican múltiples capas de procesamiento, RoCE v2 permite el acceso directo a la memoria entre sistemas, minimizando la participación de la CPU y reduciendo la latencia. Esto hace que RoCE v2 sea particularmente ventajoso en escenarios que exigen una comunicación de datos rápida y eficiente, como entornos de computación de alto rendimiento (HPC), centros de datos y computación en la nube.

El protocolo se basa en la base de su predecesor, RoCE v1, al introducir mejoras que abordan ciertas limitaciones y mejoran el rendimiento general. RoCE v2 utiliza una infraestructura Ethernet convergente, lo que permite la coexistencia del tráfico Ethernet tradicional con el tráfico RDMA en la misma red. Esta convergencia agiliza la gestión de la red y elimina la necesidad de una estructura RDMA independiente, lo que hace que RoCE v2 sea más accesible y rentable.

RoCE v2 Network Infrastructure

Tarjeta de red RoCE

Un elemento central del ecosistema RoCE v2 es la tarjeta de red RoCE, una tarjeta de interfaz de red (NIC) especializada diseñada para admitir operaciones RDMA. Estas tarjetas, también conocidas como adaptadores RoCE, son fundamentales para permitir el acceso directo a la memoria entre sistemas. Las tarjetas de red RoCE están equipadas con las capacidades de hardware necesarias para descargar las operaciones RDMA de la CPU, lo que resulta en una menor latencia y un mejor rendimiento general del sistema.

Tarjeta de red RoCE

El núcleo de los conmutadores de alto rendimiento reside en los chips de reenvío que emplean. En particular, los chips de la serie Tomahawk3 se emplean ampliamente en conmutadores, con una tendencia creciente hacia que los conmutadores admitan los chips más nuevos de la serie Tomahawk4. Este cambio resalta la importancia de estos chips, que se utilizan comúnmente en el mercado comercial actual para reenviar datos.

Chips de la serie Tomahawk3

RoCE v2 vs. Infinibanda

RoCE v2 (RDMA sobre Ethernet convergente versión 2) e InfiniBand son tecnologías diseñadas para proporcionar comunicación de alta velocidad y baja latencia en centros de datos y entornos informáticos de alto rendimiento. A continuación se muestran algunas diferencias clave en varios aspectos.

RoCE v2 vs. Infinibanda

Capa fisica

  • RoCE v2: Se basa en una infraestructura Ethernet, lo que permite la convergencia del almacenamiento y el tráfico de datos regular en la misma red. Esto también facilita la integración en las configuraciones de centros de datos existentes.

  • InfiniBand:Utiliza una estructura dedicada para la comunicación, separada de Ethernet. A menudo requiere una red InfiniBand especializada, lo que puede requerir cableado y conmutadores separados.

Pila de protocolos y pila de red

  • RoCE v2: Utiliza el protocolo RDMA (Acceso remoto directo a memoria) a través de Ethernet. Se integra con la pila TCP/IP tradicional, lo que lo hace compatible con protocolos de red estándar.

  • InfiniBand: Tiene su propia pila de protocolos optimizada para comunicación de alta velocidad y baja latencia y pila de red, que puede requerir controladores y configuraciones especializados.

Conmutación

  • RoCE v2: Puede funcionar a través de conmutadores Ethernet estándar con funciones de puente de centro de datos (DCB), que admiten Ethernet sin pérdidas.

  • InfiniBand: Requires switches InfiniBand diseñados específicamente para comunicaciones de alto rendimiento y baja latencia.

Congestión

RoCE v2:

  • Manejo de la congestión: RoCE v2 se basa en las funciones de puente del centro de datos (DCB) de los conmutadores Ethernet para manejar la congestión. DCB proporciona un entorno Ethernet sin pérdidas, evitando la pérdida de paquetes debido a la congestión.

  • Control de congestión: El propio RoCE no tiene mecanismos de control de congestión integrados. En cambio, depende de la infraestructura Ethernet subyacente para gestionar la congestión.

InfiniBand:

  • Manejo de la congestión: InfiniBand tiene soporte nativo para la gestión de la congestión. Emplea mecanismos como el control de flujo basado en créditos para evitar la congestión y garantizar una comunicación sin pérdidas.

  • Control de congestión: InfiniBand incluye algoritmos de control de congestión y enrutamiento adaptativo para ajustar dinámicamente las rutas de tráfico y evitar la congestión en la red.

Enrutamiento

RoCE v2:

  • Mecanismo de enrutamiento: RoCE v2 normalmente se basa en protocolos de enrutamiento Ethernet tradicionales, como el protocolo de información de enrutamiento (RIP) o abrir primero la ruta más corta (OSPF) para las decisiones de enrutamiento.

  • Topología: RoCE se utiliza a menudo en topologías Ethernet estándar y las decisiones de enrutamiento están influenciadas por la infraestructura Ethernet subyacente.

InfiniBand:

  • Mecanismo de enrutamiento: InfiniBand tiene sus mecanismos de enrutamiento optimizados para comunicaciones de alto rendimiento y baja latencia. Admite múltiples rutas para redundancia y equilibrio de carga.

  • Topología: InfiniBand admite una variedad de topologías, incluidas configuraciones de árbol grueso, hipercubo y multirraíl. La elección de la topología puede influir en las decisiones de enrutamiento.

La elección entre RoCE v2 e InfiniBand depende de factores como la infraestructura existente, los requisitos de la aplicación y las necesidades específicas del entorno. RoCE v2 proporciona una ruta de integración más fluida en las redes Ethernet existentes, mientras que InfiniBand puede ser preferido en entornos informáticos de alto rendimiento que exigen los más altos niveles de rendimiento y escalabilidad.

UEC trae un nuevo protocolo de transporte

El Ultra Ethernet Consortium (UEC) se fundó formalmente el 19 de julio, con el objetivo principal de superar las capacidades actuales de Ethernet. Los miembros fundadores incluyen AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta y Microsoft. En conjunto, estas empresas aportan décadas de experiencia en infraestructura de redes, inteligencia artificial, tecnologías de nube e implementaciones informáticas de alto rendimiento.

El consorcio sostiene que el acceso remoto directo a la memoria (RDMA), establecido hace décadas, se ha vuelto obsoleto para las rigurosas demandas del tráfico de red AI/ML. La tendencia de RDMA a transferir datos en bloques de tráfico considerables puede provocar desequilibrios en los enlaces y cargas excesivas. UEC aboga por el inicio del desarrollo de un protocolo de transporte contemporáneo que integre RDMA para aplicaciones emergentes.

Resumen

RoCE v2 se erige como una fuerza formidable en el ámbito de las tecnologías RDMA y ofrece una poderosa solución para organizaciones que buscan comunicación de datos de alto rendimiento y baja latencia. Su convergencia sobre la infraestructura Ethernet, junto con los avances aportados por el protocolo de transporte de UEC, posiciona a RoCE v2 como una opción versátil y rentable para diversas aplicaciones, desde entornos HPC hasta computación en la nube.

Si bien las comparaciones con InfiniBand resaltan las fortalezas de RoCE v2, las organizaciones deben considerar sus requisitos específicos y las infraestructuras existentes al elegir la solución RDMA más adecuada. A medida que la tecnología continúa evolucionando, RoCE v2 y sus innovaciones asociadas están preparadas para desempeñar un papel fundamental en la configuración del futuro de las redes de alto rendimiento.

También podría interesarte

Conocimiento
Conocimiento
See profile for Sheldon.
Sheldon
¿Qué es el puerto SFP del switch Gigabit?
ene 29, 2023
49.4k
Conocimiento
Conocimiento
Conocimiento
See profile for Sheldon.
Sheldon
Análisis de PON: Qué es OLT, ONU, ONT y ODN
oct 22, 2018
41.5k
Conocimiento
See profile for Migelle.
Migelle
Switch PoE vs PoE+ vs PoE++: ¿Cómo elegir?
ene 18, 2022
29.0k
Conocimiento
Conocimiento
Conocimiento
Conocimiento
See profile for Vincent.
Vincent
¿Qué es un SFP BiDi y tipos de SFP BiDi?
mar 31, 2022
18.9k
Conocimiento
See profile for Sheldon.
Sheldon
RIP vs OSPF: ¿Cuál es la diferencia?
jul 9, 2021
31.1k