Français

L'Avenir des Modules Optiques Intégrés pour le Calcul Haute Performance

Publié le 26 mars, 2024 by
91

Avec le développement rapide de l’intelligence artificielle (IA) et de l’apprentissage automatique (ML), le calcul haute performance (HPC) et la puissance de calcul puissante sont devenus des éléments clés pour promouvoir les applications et l’innovation de l’IA.

Lors de la création d’un cluster IA/ML, les exigences de transmission à grande vitesse et de faible latence des modules optiques deviennent particulièrement importantes. Cet article discutera de la stratégie et du développement futur des modules optiques intégrés à l'ère de la puissance de calcul.

Le GPU NVIDIA Ouvre l'Ère de la Puissance de Calcul de l'IA

En tant que premier fabricant mondial d'unités de traitement graphique (GPU), NVIDIA joue un rôle clé dans le développement de la puissance de calcul de l'IA. Les capacités de calcul parallèle élevées et les puissantes performances de traitement de son architecture GPU offrent un solide support pour la formation et le raisonnement des algorithmes d'IA.

Cependant, parvenir à un calcul haute performance nécessite également une transmission de données à haut débit et une communication à faible latence, ce qui nécessite de s'appuyer sur une technologie de module optique avancée.

Demandes du Module Optique du Cluster AI/ML

Lors de la création de clusters IA/ML à grande échelle, le besoin de modules optiques devient particulièrement important. Premièrement, le calcul haute performance nécessite une transmission de données à grande vitesse pour accélérer la formation et l’inférence. Deuxièmement, une communication à faible latence est essentielle à la prise de décision en temps réel et aux applications interactives.

De plus, la fiabilité et la stabilité sont également des caractéristiques importantes des modules optiques pour garantir un fonctionnement continu et des performances efficaces des centres de données.

Les unités de cluster IA/ML font référence à des unités ou nœuds informatiques indépendants utilisés pour effectuer des tâches informatiques et traiter des données dans des applications d'intelligence artificielle (IA) et d'apprentissage automatique (ML). Ces unités sont généralement composées de plusieurs dispositifs informatiques, tels qu'une unité centrale de traitement (CPU), une unité de traitement graphique (GPU), un accélérateur dédié (tel que le TPU), etc.

L'objectif de l'unité de cluster IA/ML est d’améliorer les performances et l'efficacité du calcul grâce au calcul parallèle et au traitement distribué. Ils peuvent gérer simultanément de grandes quantités de données et des tâches informatiques complexes pour réaliser des tâches d’IA/ML telles que la formation de modèles, la réalisation d'inférences et le traitement d'ensembles de données à grande échelle.

Une unité de cluster IA/ML se compose de 32 serveurs, chaque serveur contient 8 H100GPU. La bande passante d'un serveur est de 28,8 Tb/s et la bande passante de liaison montante vers le commutateur MoR/EoR est de 4 Tb/s, ce qui nécessite 10 modules 400G (côté serveur) et 5 modules 800G (côté commutateur). Une unité de cluster IA/ML nécessite 320 modules 400G et 160 modules 800G. Si l'on se réfère à l'architecture réseau à deux couches et à un taux de convergence de 1:1, 320 modules 800G sont nécessaires.

OpenAI affirme qu'environ 30 000 GPU sont nécessaires pour exécuter ChatGPT. Microsoft a également confirmé qu'au moins des dizaines de milliers de GPU sont nécessaires pour exécuter ChatGPT, et on estime qu'environ 100 000 modules optiques sont nécessaires.

Le marché du matériel d'IA représente environ 12 % et les modules optiques représentent 5 à 8 % de l'ensemble du marché du matériel. Lorsque le marché global de l’IA atteindra des milliards de dollars, la demande de modules optiques atteindra également des dizaines de milliards de dollars.

Vous Pouvez Également Lire : Comment le Module Optique 800G Aide-t-il l'Ère de l'Informatique IA ?

AI

Types de Modules Optiques à l'Ère de l'IA

À l'ère de la puissance de calcul de l'IA, la technologie des modules optiques continue de progresser et d'innover, et les types de modules optiques se développent rapidement pour répondre aux besoins du calcul haute performance et de la transmission de données. Voici quelques types de modules optiques actuellement courants dans le domaine des communications optiques à haut débit :

  • Module Optique QSFP-DD : le module optique QSFP-DD (Quad Small Form-Factor Pluggable Double Density) est une solution d'interconnexion optique haute densité et haute bande passante. Il prend en charge jusqu'à 8 canaux fibre optique, et chaque canal peut atteindre un débit supérieur à 200 Gbit/s. Les modules optiques QSFP-DD sont largement utilisés dans le calcul haute performance et les centres de données pour une transmission rapide des données et une interconnexion réseau à haut débit.

  • Module optique OSFP : le module optique OSFP (Octal Small Form-Factor Pluggable) est une solution d'interconnexion optique haute vitesse et haute densité. Il prend en charge jusqu'à 8 canaux fibre optique, la vitesse de chaque canal atteignant plus de 400 Gbit/s. Les modules optiques OSFP sont largement utilisés dans le calcul haute performance, les supercalculateurs et les centres de données pour répondre aux besoins de transmission de données à grande échelle.

Qu'est-ce que le Module Optique LPO ?

Le module optique LPO (Linear Drive Pluggable Optics) est un type d'emballage de module optique. Le module optique LPO utilise la technologie d'entraînement linéaire et présente une conception enfichable. Il est généralement emballé avec des dimensions et des normes d'interface spécifiques pour le rendre compatible avec d'autres modules et dispositifs optiques.

Les modules optiques LPO peuvent être utilisés dans les communications optiques à haut débit et les applications de centres de données, offrant une densité et une flexibilité de bande passante élevées, et permettant d'atteindre des vitesses de modulation plus élevées et une consommation d'énergie réduite en fournissant un courant et une tension plus élevés.

Bien que le degré de standardisation des modules optiques LPO puisse être relativement faible, il représente néanmoins un type d'emballage de module optique spécifique.

Raisons du Choix du Module Optique LPO

  • Exigences de Haute Performance : les modules optiques LPO conviennent aux scénarios d'application nécessitant une vitesse élevée, une bande passante élevée et une faible latence, tels que les centres de données, le cloud computing et le calcul haute performance.

  • Enfichabilité et Flexibilité : la conception enfichable du module optique LPO facilite la maintenance et la mise à niveau, tout en offrant flexibilité et évolutivité de l'architecture réseau.

  • Avantages de la Technologie d'Entraînement Linéaire : les modules optiques LPO utilisent la technologie d'entraînement linéaire pour fournir une vitesse de modulation plus élevée et une meilleure intégrité du signal, améliorant ainsi la qualité de transmission et les performances des signaux optiques.

Défis Rencontrés par les Modules Optiques LPO

L'Interopérabilité Manque de Normes d'Interface Optique et Électrique Unifiées

Les modules optiques LPO à commande linéaire nécessitent des puces de commutation ASIC dotées de fortes capacités de compensation. Actuellement, seules la puce de commutation Tomahawk de Broadcom et la puce de commutation Spectrum-4 de Nvidia prennent en charge les modules optiques LPC. De plus en plus de fabricants lanceront progressivement des puces de commutation prenant en charge le LPO. Les modules optiques s'adaptant aux puces de commutation multifournisseurs (ASIC) nécessitent des normes d'interface électrique unifiées. L'OIF discute actuellement des normes pertinentes.

L'interopérabilité des modules optiques LPO entre différents fabricants de modules optiques nécessite des normes d'interface optique unifiées. Le groupe de travail IEEE802.3 est tenu d'établir les normes pertinentes.

Le Switch doit Effectuer une Compensation Différenciée pour les Modules LPO des Différents Ports

Les longueurs de trace PCB des différents ports du commutateur à la puce du commutateur sont incohérentes, ce qui nécessite une compensation différenciée pour les modules LPO des différents ports, ce qui pose certains défis pour la formulation de normes de ports électriques unifiées. Étant donné que les cartes réseau ont moins de ports (1 ou 2 ports) et que le câblage du PCB est simple et fixe, il n'est pas nécessaire de compenser différentiellement les modules optiques LPO, les modules optiques LPO seront donc les premiers à être utilisés.

Conlusion

À mesure que la puissance de calcul de l’IA continue de s’améliorer, le calcul haute performance et la technologie des modules optiques jouent un rôle clé. Les modules optiques QSFP-DD et OSFP sont des types de modules optiques à haut débit courants qui répondent aux exigences de hautes performances des clusters AI/ML à grande échelle.

Les modules optiques LPO présentent les avantages d'une faible consommation d'énergie, de hautes performances et de fiabilité, et sont devenus un choix populaire. Cependant, les modules optiques LPO sont encore confrontés à des défis tels que les avancées technologiques, le coût et la standardisation.

À l'avenir, avec les progrès et l'innovation continus de la technologie, les modules optiques joueront un rôle encore plus important à l'ère de la puissance de calcul, en fournissant un soutien solide aux applications et à l'innovation de l'IA.

Cela pourrait également vous intéresser

Connaissances
Connaissances
Connaissances
See profile for Migelle.
Migelle
Switch PoE, PoE+ ou PoE++ : Lequel choisir ?
25 août, 2021
47.2k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre LACP et PAGP ?
29 déc, 2021
16.7k
Connaissances
See profile for Migelle.
Migelle
Switch PoE actif ou passif : lequel choisir ?
28 févr, 2022
19.8k
Connaissances
See profile for Vincent.
Vincent
Comprendre le transceiver bidirectionnel BiDi
05 janv, 2022
9.3k
Connaissances
See profile for Moris.
Moris
Câbles à fibre optique Simplex ou Duplex
25 nov, 2018
17.7k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre RIP et OSPF ?
10 juin, 2021
22.8k