Cancelar
https://media.fs.com/images/community/wp-content/uploads/2019/04/Cover-1.jpg

RoCE: RDMA a través de Ethernet convergente para conseguir un rendimiento de alta eficiencia en tu red

Irving

Traductor Don Juan
8 de julio de 2021

En la era de los datos, los requisitos de una red más rápida, eficiente y escalable siguen en alza. Dado que las conexiones TCP/IP Ethernet tradicionales son intensivas en CPU y requieren un procesamiento y copia extra de los datos, ya no pueden satisfacer las necesidades actuales de la red. En ese contexto, llega el RDMA a través de Ethernet convergente (RoCE).

Conocimiento de fondo: ¿Qué es el RDMA?

El acceso directo a memoria remota (RDMA, remote direct memory access) es una tecnología que permite el acceso directo desde la memoria de un host o servidor a la de otro host o servidor sin que intervenga la CPU. De este modo las CPU quedan libres para realizar las tareas correspondientes, como ejecutar aplicaciones y procesar cantidades masivas de datos. Así pues, de forma rentable podrás conseguir un rendimiento de la red y del host con menor latencia, menor carga de la CPU y mayor ancho de banda de forma rentable.

RDMA Technology

Figura 1: Tecnología RDMA

Vista general del RoCE

¿Qué es el RoCE?

El RoCE es un protocolo de red definido en el estándar de la InfiniBand Trade Association (IBTA) que permite el uso del RDMA en una red Ethernet convergente. En pocas palabras, puede considerarse como la aplicación de la tecnología RDMA en centros de datos, nube, almacenamiento y entornos virtualizados hiper convergentes. Posee todas las ventajas de la tecnología RDMA y la familiaridad del Ethernet.

Tipos de RoCE

En general, existen dos versiones de RoCE: RoCE v1 y RoCE v2. Depende del adaptador o tarjeta de red que se utilicen.

Tipos de RoCE/th> Características
RoCE v1 Es un protocolo de capa de enlace Ethernet que permite la comunicación entre dos hosts del mismo dominio de difusión Ethernet (VLAN).
RoCE v2 Esta versión no está limitada a un único dominio de difusión (VLAN) como lo estaba la v1. Al cambiar la encapsulación de los paquetes para incluir cabeceras IP y UDP, el RoCE v2 se puede utilizar en las redes L2 y L3.

RoCE v1: Es un protocolo de capa de enlace Ethernet que permite la comunicación entre dos hosts del mismo dominio de difusión Ethernet (VLAN). Utiliza el Ethertype 0x8915, que limita la longitud de la trama a 1500 bytes para una trama Ethernet estándar y a 9000 bytes para una trama Ethernet jumbo.

RoCE v2: Esta versión no está limitada a un único dominio de difusión (VLAN) como lo estaba la v1. Al cambiar la encapsulación de los paquetes para incluir cabeceras IP y UDP, el RoCE v2 se puede utilizar en las redes de capa 2 y capa 3. Esto permite el enrutamiento de capa 3 que permite el RDMA en las redes con múltiples subredes para una gran escalabilidad. Por ello, el RoCE v2 también se considera RoCE enrutable (RRoCE). Gracias a la llegada de RoCE v2, ahora también es posible la multidifusión IP.

RoCE v1 vs RoCE v2 Packet Format

Figura 2: RoCE v1 vs RoCE v2 : Formato de paquetes

¿Cómo se realiza el RoCE?

Generalmente, para realizar el RDMA a través de Ethernet convergente para un centro de datos, se puede instalar un adaptador de red o controladores de tarjetas compatibles con el RoCE. Todas las NICs Ethernet requieren tarjetas adaptadoras de red RoCE. Los controladores RoCE están disponibles en Red Hat, Linux, Microsoft Windows y otros sistemas operativos comunes. El RoCE está disponible de dos maneras. En el caso de los switches de red, puedes utilizar uno cuyo sistema operativo soporte el control de flujo prioritario (PFC, priority flow control). En cuanto a un servidor de rack o un host, tendrás que utilizar una tarjeta adaptadora de red, como ConnectX-3 pro, ConnectX-4 o superiores.

RoCE

Figura 3: RoCE

Ventajas del RoCE

Poca implicación de la CPU: Accede a la memoria del switch o servidor remoto sin consumir ciclos de CPU en el servidor remoto, lo que permite un uso completo del ancho de banda disponible y una mayor escalabilidad.
Before Vs. After RoCE

Figura 4: Antes y después del RoCE

Copia cero: Envío y recepción de datos hacia búferes remotos y viceversa.
Alto rendimiento: El RoCe ha mejorado la latencia y el caudal de tráfico, y consecuentemente, ha aportado beneficios al rendimiento de la red.
Ahorro de costos: Con el RoCE no es necesario comprar nuevos equipos ni sustituir la infraestructura Ethernet para manejar la enorme cantidad de datos, de este modo, las empresas podrán ahorrar una gran cantidad de gastos de capital.

Preguntas frecuentes sobre el RoCE

A continuación enumeramos algunas de las preguntas más frecuentes sobre RoCE para que lo entiendas mejor.

¿Qué switches o tarjetas/adaptadores de red FS son compatibles con el RoCE?

Hasta ahora, los switches FS de la serie N con Cumulus OS y la serie S58/80 son compatibles con el RoCE v1 y v2. Los clientes tienen que habilitar la función PFC después de comprar un switch RDMA. En cuanto a los adaptadores y las tarjetas, los de FS.COM aún no son compatibles con el RoCE.

2. ¿Cuál es la diferencia entre el RoCE y el iWARP?

Al igual que el protocolo de red RoCE, el protocolo RDMA de área amplia de Internet (iWARP, Internet wide area RDMA protocol) también soporta la función RDMA con menor latencia. Sin embargo, el RoCE es la única solución RDMA basada en Ethernet estándar de la industria con un ecosistema de múltiples proveedores que ofrece adaptadores de red y que opera a través de switches Ethernet estándar de capa 2 y 3. El iWARP utiliza una compleja combinación de capas, que incluye la colocación directa de datos (DDP, direct data placement), un ajuste conocido como MPA (Marker PDU Aligned framing o encuadre de marcador PDU alineado) y un protocolo RDMA independiente (RDMAP) para ofrecer servicios RDMA a través de TCP/IP. Con una arquitectura tan compleja, será difícil para el protocolo iWARP aplicar el RDMA a los marcos de transporte de software existentes, por lo que el caudal de datos, la latencia y la utilización de la CPU del iWARP se verán mermados.

iWARP's Complex Network Layers Vs. RoCE’s Simpler Model

Figura 5: Capas de red complejas de iWARP vs el modelo más sencillo de RoCE

3. ¿Los adaptadores RoCE pueden comunicarse con otros tipos de adaptadores, como iWARP?

Los adaptadores RoCE sólo pueden comunicarse con otros adaptadores RoCE. Cualquier configuración que intente mezclar tipos de adaptadores, por ejemplo adaptadores RoCE combinados con adaptadores iWARP, probablemente volverá a las conexiones TCP/IP tradicionales.

Conclusión

Si se ejecuta el RDMA, es posible aliviar la carga de los movimientos de datos y conseguir una mayor disponibilidad de los recursos CPU de la aplicación. Aquellos que adopten el RoCE podrán beneficiarse de las capacidades del RDMA sin cambiar su infraestructura de red. Al reducir la latencia de la red Ethernet y aliviar la sobrecarga de la CPU, el RoCE aumenta el rendimiento en aplicaciones de búsqueda, almacenamiento, bases de datos, financieras y de alta velocidad de transacciones. Al aumentar la eficiencia de la CPU y mejorar el rendimiento de las aplicaciones, el RoCE puede reducir el número de servidores necesarios, por lo que se ahorra energía y se reduce la huella de los centros de datos basados en Ethernet.

358

Te puede interesar