Recommandations quant au Choix des Produits InfiniBand pour le Calcul Haute Performance
Lors du salon Computex 2023, NVIDIA a dévoilé une gamme variée de produits de pointe, englobant des puces avancées, des architectures de supercalculateurs et des switchs sophistiqués. On notera en particulier le formidable supercalculateur d'HPC, NVIDIA Helios. Destiné à exploiter les réseaux Quantum-2 InfiniBand, il interconnectera de manière complexe quatre systèmes DGX GH200, améliorant ainsi de manière significative l'efficacité de l'entraînement des modèles d'HPC à grande échelle.
Les indicateurs sont nombreux, suggérant un changement décisif dans les centres de données vers l'informatique accélérée, un élan propulsé par l'AIGC. En réponse aux demandes croissantes de calcul haute performance (HPC), il existe un besoin palpable d'interconnectivité accélérée et de solutions réseau plus intelligentes. Dans ce contexte, les produits InfiniBand ont émergé comme le point central de l'attention de l'industrie, répondant méticuleusement à ces exigences impératives.
Principes de Base d'InfiniBand
InfiniBand est une technologie d'interconnexion à grande vitesse et à faible latence principalement utilisée dans les centres de données et les environnements de calcul à haute performance (HPC). Elle fournit une structure haute performance pour connecter les serveurs, les dispositifs de stockage et d'autres ressources réseau au sein d'une grappe ou d'un centre de données. L'émergence de la technologie InfiniBand est étroitement liée à l'importante latence du réseau et à la surcharge du système d'exploitation associées aux protocoles TCP/IP traditionnels.
Le protocole TCP traditionnel est un protocole de transmission largement adopté, qui trouve son application dans toute une série d'appareils allant des appareils quotidiens tels que les réfrigérateurs aux superordinateurs sophistiqués. Cependant, son adoption a un coût substantiel : TCP est complexe, caractérisé par une base de code étendue et de nombreuses exceptions, et s'avère difficile à désinstaller.
En revanche, InfiniBand utilise un mécanisme de contrôle de flux basé sur la confiance, qui garantit l'intégrité de la connexion et minimise la perte de paquets de données. Dans le cadre de InfiniBand, la transmission des données n'a lieu que lorsque la mémoire tampon de réception dispose d'un espace suffisant. Une fois la transmission des données terminée, le destinataire signale la disponibilité de l'espace tampon, ce qui élimine le délai de retransmission associé à la perte initiale de paquets de données. Cette méthode améliore considérablement l'efficacité et les performances globales.
InfiniBand sur le Marché
La technologie InfiniBand est développée sous la supervision de l'IBTA (InfiniBand Trade Association), qui est spécifiquement responsable du maintien et de la promotion des normes InfiniBand. En outre, l'IBTA assure la conformité et effectue des tests d'interopérabilité pour les produits commerciaux InfiniBand. Parmi les neuf principaux directeurs de l'InfiniBand Trade Association, seules deux entreprises - Mellanox et Emulex - sont spécialisées dans l'InfiniBand. Emulex a été rachetée par Avago en 2015 en raison de ses faibles performances commerciales. Actuellement, Mellanox domine le marché de l'InfiniBand, le nombre de déploiements de clusters utilisant ses produits dépassant de loin ceux de ses concurrents.
Principaux Avantages d'InfiniBand
Globalement, la technologie InfiniBand présente les avantages suivants :
-
Vitesse et évolutivité élevées
-
Faible latence
-
Faible consommation d'énergie
Pour plus d'informations sur InfiniBand, veuillez vous référer à la section "Se familiariser avec InfiniBand".
InfiniBand dans les Réseaux HPC
Dans le domaine du calcul à haute performance (HPC), les réseaux d'interconnexion à grande vitesse (HSI) jouent un rôle crucial dans la performance et l'efficacité des systèmes. Parmi ces réseaux, la technologie InfiniBand est devenue un composant clé largement utilisé dans le domaine du calcul à haute performance, grâce à ses performances exceptionnelles. InfiniBand est l'une des technologies HSI qui se développent le plus rapidement. Elle offre une bande passante allant jusqu'à 200 Gbps et une latence point à point inférieure à 0,6 microseconde, ce qui permet de soutenir solidement la construction de grappes de calcul à haute performance.
Grâce aux capacités de mise en réseau à grande vitesse d'InfiniBand, les systèmes HPC peuvent combiner efficacement plusieurs serveurs, ce qui permet d'obtenir une évolutivité linéaire des performances. Cette technologie joue un rôle essentiel dans le développement des grappes de calcul à haute performance, en particulier dans la construction de superordinateurs. Les entreprises, ainsi que les centres de données de grande ou de très grande taille, bénéficient considérablement de sa fiabilité, de sa disponibilité, de son évolutivité et de ses performances supérieures. Par conséquent, l'importance de la technologie InfiniBand dans le domaine du calcul intensif ne se traduit pas seulement par l'amélioration des performances des grappes de calcul, mais aussi par la fourniture d'un soutien essentiel aux centres de données de différentes tailles, ce qui favorise le développement global de l'écosystème du calcul intensif.
Vendeurs de Produits InfiniBand sur le Marchét
Mellanox Technologies (Racheté par NVIDIA® Networking)
Mellanox, acteur majeur dans le domaine de l'InfiniBand (IB), a été racheté par NVIDIA en avril 2020. La plateforme officielle pour l'achat de produits Mellanox est le NVIDIA Networking Store. Ce magasin est efficace et fiable, offrant une large gamme de connecteurs. Cependant, certains produits peuvent ne pas être directement disponibles sur le site officiel. Dans les cas où les produits ne sont pas disponibles sur le site officiel, les clients ont la possibilité d'acheter auprès des partenaires de NVIDIA. NVIDIA® Partner Network
NVIDIA® Partner Network
Les partenaires de NVIDIA sont les principaux fournisseurs des dernières solutions et équipements du marché, y compris les câbles et les émetteurs-récepteurs IB. Les câbles et émetteurs-récepteurs IB sont distribués dans le monde entier par le réseau de distributeurs/revendeurs agréés de NVIDIA. Des informations sur les distributeurs/revendeurs sont disponibles sur le site officiel de NVIDIA. En raison de l'étroite collaboration entre les distributeurs/partenaires et NVIDIA, des problèmes tels que les pénuries de connecteurs, l'approvisionnement insuffisant du marché et les longs cycles de livraison peuvent survenir.
FS.com
FS est un partenaire d'élite de NVIDIA® et propose une grande variété de produits InfiniBand sur son site officiel, notamment des switchs NVIDIA® InfiniBand, des modules InfiniBand, des câbles InfiniBand et des adaptateurs NVIDIA® InfiniBand. Le site FS dispose d'un stock important de produits InfiniBand et assure une livraison rapide. Si vous souhaitez acheter des produits InfiniBand ou obtenir des solutions InfiniBand, vous pouvez contacter FS pour obtenir de l'aide.
Conseils pour Choisir un Produit InfiniBand
Les produits InfiniBand jouent un rôle crucial dans les centres de données informatiques à haute performance, et le choix des produits appropriés est primordial pour garantir le succès opérationnel. Le système complet InfiniBand comprend des switchs InfiniBand, des adaptateurs InfiniBand, InfiniBand LongHaul, une passerelle InfiniBand vers Ethernet, des câbles et des émetteurs-récepteurs InfiniBand, la télémétrie et la gestion logicielle InfiniBand, ainsi que le logiciel d'accélération InfiniBand.
Les produits InfiniBand doivent être choisis avec la plus grande attention pour les centres de données informatiques à haute performance. Les exigences en matière de largeur de bande et de distance, les connecteurs, le budget, la compatibilité, la fiabilité et les besoins futurs sont autant d'éléments qui contribuent à la sélection du connecteur IB approprié.
Concernant les produits d'interconnexion de réseaux InfiniBand :
-
Les câbles en cuivre à grande vitesse DAC offrent une solution économique pour les interconnexions à grande vitesse et à courte distance.
-
Les câbles actifs AOC utilisent la technologie optique pour la transmission de données sur de plus longues distances.
-
Les modules optiques sont couramment utilisés pour les interconnexions à grande vitesse sur de longues distances.
Connaître les différentes catégories de produits, les vitesses et les modules d'emballage permet de prendre des décisions judicieuses, tandis que le choix du bon fournisseur garantit la réception de produits InfiniBand de haute qualité qui répondent aux exigences en matière de performances et de budget.
InfiniBand ou Ethernet : InfiniBand est meilleur pour le calcul haute performance
Certains utilisateurs se demandent encore quelle est la meilleure solution, InfiniBand ou Ethernet, pour la puissance de calcul HPC. InfiniBand est plus adapté à l'informatique de haute performance.
Des analyses détaillées sur les différences spécifiques entre InfiniBand et Ethernet sont disponibles dans l'article de la communauté FS "InfiniBand vs. Ethernet : Qu'est-ce que c'est ?"
Dans le domaine du calcul à haute performance (HPC), InfiniBand présente des avantages par rapport à Ethernet sur plusieurs points essentiels :
Mécanisme de Contrôle des Flux
InfiniBand utilise un contrôle de flux de bout en bout, garantissant que les messages ne sont pas encombrés pendant la transmission, ce qui permet d'obtenir un réseau sans perte. En revanche, le mécanisme de contrôle de flux d'Ethernet est relativement simple, ce qui peut entraîner des encombrements et des pertes de données.
Avantage de la Topologie du Réseau
InfiniBand introduit un gestionnaire de sous-réseau dans son réseau de couche 2, capable de configurer l'ID local des nœuds et de calculer/distribuer des informations sur le chemin d'acheminement par le biais du plan de contrôle. Cela facilite le déploiement de réseaux à grande échelle, en évitant les problèmes d'inondation, de VLAN ou de rupture de boucle. Cela confère à InfiniBand un avantage unique par rapport à Ethernet.
Paramètres de Performance
InfiniBand offre une plus grande largeur de bande, une latence plus faible et une gigue moins importante, ce qui en fait un choix idéal pour une transmission de données rapide et fiable dans les environnements HPC. Par rapport à Ethernet, InfiniBand offre des taux de transfert de données plus rapides allant de 40G à 400G, alors qu'Ethernet est actuellement limité à 100G.
Adaptation aux Charges de Travail des GPU
InfiniBand est mieux adapté à la gestion des charges de travail des GPU, permettant un transfert de données à grande vitesse entre les CPU et les GPU. Cet aspect est particulièrement important pour les tâches exigeant une grande puissance de calcul, pour lesquelles Ethernet peut présenter des faiblesses relatives.
Support pour le Calcul Parallèle
InfiniBand permet à plusieurs processeurs de communiquer simultanément, offrant ainsi des performances supérieures en matière de calcul parallèle. Ceci est essentiel pour les applications nécessitant des capacités de calcul parallèle étendues.
Classement Mondial HPC TOP500
Selon le dernier classement mondial HPC TOP500, la part de marché d'InfiniBand n'a cessé d'augmenter et domine actuellement le TOP100, tandis que la part de marché d'Ethernet est en déclin.
Conclusion
Nous sommes actuellement dans une ère de croissance de l'informatique générale (AIGC). Les géants des plateformes comme OpenAI, Microsoft et Google, ainsi que les entreprises spécialisées dans les applications comme Midjourney et Character Al, accélèrent le développement et l'évolution des applications. En outre, la rapide émergence de nouvelles entreprises et applications crée une atmosphère hautement compétitive dans le domaine de l'HPC.
Il est évident que la puissance informatique joue un rôle crucial dans la détermination de la productivité. Actuellement, il y a une pénurie notable de produits NVIDIA IB. Pour répondre aux exigences de votre entreprise, il est essentiel de choisir le bon fournisseur et les bons produits InfiniBand.