Español

SuperNIC: El acelerador de red para IA

Actualizado el 02 de febrero de 2024 por
81

A medida que aumentan la complejidad y la escala de la IA, las soluciones de redes tradicionales tienden a no cumplir con los requisitos intensivos de datos de estos sistemas avanzados. Para abordar los problemas que enfrentan las cargas de trabajo de IA, se creó SuperNIC. En este artículo, analizaremos las capacidades transformadoras de SuperNIC, exploraremos cómo revoluciona el rendimiento de la red y abre nuevas fronteras en la innovación impulsada por la IA.

¿Qué es un SuperNIC?

SuperNIC representa una categoría emergente de aceleradores de red meticulosamente diseñados para mejorar el rendimiento de cargas de trabajo de IA a hiperescala dentro de entornos de nube basados en Ethernet. Ofrece una conectividad de red incomparable diseñada para la comunicación de GPU a GPU, alcanzando velocidades de hasta 400 Gb/s mediante la utilización de acceso remoto directo a memoria (RDMA) a través de la tecnología Ethernet convergente (RoCE).

SuperNIC garantiza la ejecución rápida y eficiente de las cargas de trabajo de IA, constituyéndolas como elementos fundamentales para impulsar el futuro de la informática de IA. Esta fortaleza proviene de los atributos únicos de SuperNIC:

  • Aprovechando los datos de telemetría en tiempo real y los algoritmos de red, se implementa un control de congestión avanzado para gestionar y prevenir eficazmente la congestión dentro de las redes de IA.

  • La reordenación de paquetes de alta velocidad garantiza la recepción y el procesamiento de paquetes de datos en el orden de transmisión original, preservando la integridad secuencial del flujo de datos.

  • Con un diseño de bajo perfil y bajo consumo de energía, SuperNIC se adapta hábilmente a cargas de trabajo de IA dentro de presupuestos de energía limitados.

  • La capacidad de computación programable en la ruta de entrada/salida (E/S) permite la personalización y extensibilidad de la infraestructura de red en los centros de datos en la nube de IA.

  • Optimización integral de la IA en toda la pila, que abarca informática, redes, almacenamiento, software del sistema, bibliotecas de comunicación y marcos de aplicaciones.

La IA promueve el desarrollo de SuperNIC

El éxito de la inteligencia artificial está estrechamente ligado a la computación acelerada por GPU, esencial para procesar grandes conjuntos de datos, entrenar modelos de IA expansivos y facilitar la inferencia en tiempo real. Si bien esta potencia informática mejorada ha introducido nuevas posibilidades, al mismo tiempo ha planteado desafíos a las redes convencionales.

Las redes tradicionales, la tecnología fundamental que respalda la infraestructura de Internet, se desarrollaron inicialmente para proporcionar una amplia compatibilidad y conectar aplicaciones poco acopladas. Su diseño no anticipó las rigurosas demandas computacionales que plantean las cargas de trabajo de IA contemporáneas, caracterizadas por un procesamiento paralelo estrechamente acoplado, transferencias rápidas de datos y patrones de comunicación distintos. Las tarjetas de interfaz de red (NIC) tradicionales se diseñaron para informática de uso general, transmisión universal de datos e interoperabilidad, y carecían de las características y capacidades necesarias para una transferencia de datos eficiente, baja latencia y el rendimiento determinista crucial para las tareas de IA. En respuesta a las demandas de las cargas de trabajo actuales de IA, han surgido las SuperNIC.

SuperNIC es más adecuado para entornos informáticos de inteligencia artificial que DPU

Las unidades de procesamiento de datos (DPU) ofrecen muchas funciones avanzadas, como alto rendimiento, conectividad de red de baja latencia y más. Desde su introducción en 2020, las DPU han ganado popularidad en la computación en la nube, principalmente debido a su capacidad para descargar, acelerar y aislar el procesamiento de la infraestructura del centro de datos. Aunque las DPU y las SuperNIC tienen capacidades para compartir, las SuperNIC están diseñadas específicamente para acelerar las redes de IA. Las principales ventajas se detallan a continuación:

  • La proporción 1:1 de GPU y SuperNIC en un sistema puede mejorar considerablemente la eficiencia de la carga de trabajo de IA, lo que resulta en una mayor productividad y mejores resultados para las empresas.

  • Las SuperNIC proporcionan 400 Gb/s de capacidad de red por GPU, superando a las DPU en entrenamiento de IA distribuida y flujos de comunicación de inferencia.

  • Para acelerar la creación de redes para la computación en la nube de IA, las SuperNIC utilizan menos potencia informática que las DPU, que requieren una cantidad significativa de recursos informáticos para descargar aplicaciones de la CPU host.

  • Los menores requisitos informáticos también dan como resultado un menor consumo de energía, lo que resulta extremadamente útil para sistemas multi-SuperNIC.

  • Las capacidades de red de IA dedicadas de SuperNIC incluyen enrutamiento adaptativo, manejo de paquetes fuera de orden y control de congestión optimizado, todo lo cual ofrece acelerar los entornos de nube de IA de Ethernet.

 
BlueField-3 DPU
BlueField-3 SuperNIC
Misión
  • Procesador de infraestructura en la nube

  • Descargue, acelere y aísle la infraestructura del centro de datos

  • Optimizado para N-S en sistemas de clase GPU

  • Redes aceleradas para la informática Al

  • La mejor red RoCE de su clase

  • Optimizado para E-W en sistemas de clase GPU

Capacidades compartidas
  • Aceleración de la red VPC

  • Aceleración del cifrado de red

  • Tubería de red programable

  • Sincronización de precisión

  • Seguridad de la plataforma

Seguridad de la plataforma
  • Computación poderosa

  • Gestión segura y sin confianza

  • Aceleración del almacenamiento de datos

  • Aprovisionamiento de infraestructura elástica

  • 1-2 DPU por sistema

  • Redes potentes

  • Conjunto de funciones de red completa

  • Optimización NVIDIA Al de pila completa

  • Diseño de bajo perfil y bajo consumo de energía

  • Hasta 8 SuperNIC por sistema

 

Conclusión

SuperNIC es una especie de acelerador de red para centros de datos de IA que proporciona conectividad confiable y fluida entre servidores GPU, creando un entorno cohesivo para ejecutar cargas de trabajo avanzadas de IA y contribuyendo al avance continuo de la informática de IA.

También podría interesarte

Conocimiento
Conocimiento
See profile for Sheldon.
Sheldon
¿Qué es el puerto SFP del switch Gigabit?
ene 29, 2023
50.4k
Conocimiento
Conocimiento
Conocimiento
See profile for Sheldon.
Sheldon
Análisis de PON: Qué es OLT, ONU, ONT y ODN
oct 22, 2018
42.4k
Conocimiento
See profile for Migelle.
Migelle
Switch PoE vs PoE+ vs PoE++: ¿Cómo elegir?
ene 18, 2022
29.5k
Conocimiento
Conocimiento
Conocimiento
Conocimiento
See profile for Vincent.
Vincent
¿Qué es un SFP BiDi y tipos de SFP BiDi?
mar 31, 2022
19.1k
Conocimiento
See profile for Sheldon.
Sheldon
RIP vs OSPF: ¿Cuál es la diferencia?
jul 9, 2021
31.5k