Français

L'Essor des Centres de Données HPC : FS Renforce les Centres de Données de Nouvelle Génération

Mis à jour depuis le 11 juin, 2024 by
85

À l'aube de l'ère du calcul à haute performance, la demande la plus importante est la puissance de calcul, et l'infrastructure cruciale est le centre de données. Le calcul intensif, en tant que nouvelle forme de productivité, évolue continuellement pour analyser et créer avec une efficacité et une rapidité accrues, ce qui pousse les centres de données à fournir des capacités de calcul plus puissantes, à traiter des volumes de données plus importants et à progresser vers des réseaux intelligents ouverts, à ultra-haut débit et à latence ultra-faible. Cet article se penche sur l'évolution des centres de données en réponse à l'ère HPC et explore la manière dont FS contribue à la construction de réseaux de centres de données HPC.

L'évolution des centres de données à l'ère du calcul intensif

Grande évolutivité des réseaux

Avec le ChatGPT qui envahit l'internet, les entreprises de divers secteurs d'activité dans le monde entier se concentrent sur les grands modèles de langage. Des géants de l'industrie comme OpenAI, Google et NVIDIA sont tous impliqués dans la recherche et le lancement de produits LLM. Ces applications nécessitent le traitement d'ensembles de données à grande échelle, dont les volumes ne cessent de croître à mesure que l'échelle et la complexité des grands modèles de langage augmentent, ce qui entraîne une croissance exponentielle de la consommation de puissance de calcul. Des rapports prévoient qu'entre 2020 et 2030, la puissance de calcul induite par le LLM sera multipliée par 500. Confrontés à des demandes de puissance de calcul aussi immenses et en croissance aussi rapide, les centres de données HPC doivent mettre en place des réseaux hautement évolutifs afin d'être bien préparés au déluge de données.

La grande évolutivité des réseaux de centres de données HPC réside dans l'optimisation de divers aspects tels que l'architecture, l'infrastructure et la gestion du réseau. Par exemple, les centres de données HPC ont besoin d'appareils à plus haut débit pour prendre en charge des débits de données plus importants et des transmissions à plus haut débit, ce qui leur permet d'accueillir sans effort les innovations futures et les demandes de données en constante évolution. Ces prévisions indiquent une augmentation significative du déploiement d'équipements 800G dans les centres de données HPC.

Global Trends in LLM Parameter Counts

Performance en temps réel et faible latence

Les applications informatiques à haute performance, telles que l'apprentissage automatique, le traitement du langage naturel et la vision par ordinateur, sont généralement gourmandes en données et nécessitent le traitement de grandes quantités d'informations. Elles nécessitent donc un accès rapide et une transmission rapide entre divers dispositifs tels que les commutateurs, les routeurs et les serveurs. Des vitesses lentes ou une latence élevée dans des réseaux de centres de données inefficaces peuvent perturber les signaux d'entrée en temps réel, réduisant l'efficacité du traitement et affectant ainsi les opérations importantes de l'entreprise. Une perte de 0,1 % des paquets du réseau peut entraîner une baisse de 50 % des performances informatiques. Il est donc nécessaire de disposer d'un réseau de centre de données sans blocage, optimisé pour le calcul intensif, afin de garantir l'exécution transparente des tâches critiques et de libérer 100 % de la puissance de calcul.

Un moyen efficace d'obtenir une faible latence dans les centres de données HPC est d'adopter des technologies de réseau qui incluent l'Accès Direct à la Mémoire à Distance (RDMA). RDMA permet le transfert direct de données entre deux mémoires de système distantes sans impliquer le système d'exploitation ou le stockage. InfiniBand, en tant que protocole réseau de nouvelle génération prenant en charge RDMA, est également fréquemment utilisé dans les centres de données conçus pour les charges de travail HPC.

Densité accrue du déploiement du réseau

Pour accélérer le déploiement de grands modèles, la taille des grappes de GPU est passée de milliers à des dizaines de milliers de cartes ; par exemple, le GPT-4 d'OpenAI utilise plus de dix mille cartes GPU pour entraîner un modèle comportant 1,8 trillion de paramètres. Cette intégration de dispositifs de calcul à haute performance dans un espace relativement compact permet de densifier les centres de données.

La communication accrue entre un grand nombre de GPU complexifie le câblage du réseau, tout en augmentant les exigences en matière de densité des ports de commutation. Selon un rapport de recherche du groupe Dell'Oro, d'ici 2027, 20 % des ports de commutation Ethernet des centres de données seront utilisés pour connecter des serveurs d'accélération prenant en charge des tâches HPC. Au cours des trois à cinq prochaines années, les réseaux à haute densité deviendront la norme dans les centres de données HPC, à mesure que le HPC progressera et se généralisera, parallèlement au déploiement d'une infrastructure technologique de nouvelle génération.

Système de gestion de réseau amélioré

Outre les améliorations du matériel et des performances mentionnées ci-dessus, les centres de données HPC doivent renforcer leurs capacités de gestion du réseau pour atteindre des performances et une fiabilité optimales. Par exemple, la visualisation de l'état opérationnel de l'ensemble du réseau du centre de données, la détection rapide des anomalies et des défaillances, ainsi que l'automatisation des tâches au sein de l'infrastructure informatique, sont autant d'éléments essentiels pour une gestion efficace des centres de données HPC.

Élever les centres de données HPC grâce aux solutions complètes de FS

Dans le paysage en évolution rapide des centres de données HPC, FS est à l'avant-garde, offrant des solutions innovantes conçues pour répondre aux exigences uniques des charges de travail HPC. Avec la solution InfiniBand H100, FS permet aux centres de données HPC d'atteindre une évolutivité, des performances et une efficacité inégalées.

Ultra performance et faible latence avec les périphériques FS NVIDIA InfiniBand

FS est devenu un partenaire Elite de confiance dans le réseau de partenaires de NVIDIA, capable de fournir des solutions HPC et d'apprentissage automatique de premier ordre. Avec une gamme variée de produits NVIDIA InfiniBand complets, FS est un fournisseur de solutions fiable sur le terrain.

Le switch NVIDIA® Quantum-2 MQM9790 InfiniBand de FS est doté de 64 ports 400 Gb/s sur 32 ports OSFP physiques, ce qui permet d'obtenir des performances et une densité de ports optimales pour les réseaux de centres de données optimisés pour le HPC. Prenant en charge la dernière technologie d'interconnexion à haut débit 400Gb/s de NVIDIA, NVIDIA Quantum-2 InfiniBand apporte une solution à haut débit, à très faible latence et évolutive qui intègre des technologies de pointe telles que RDMA, le routage adaptatif et le protocole d'agrégation et de réduction hiérarchique évolutif de NVIDIA (SHARP)™.

Les adaptateurs FS InfiniBand offrent un large éventail de fonctionnalités de réseau, de stockage et de sécurité définies par logiciel et accélérées par le matériel, permettant aux entreprises de moderniser et de sécuriser leurs infrastructures informatiques. La solution FS H100 InfiniBand offre modules et des câbles InfiniBand rentables et de haute qualité, avec des vitesses allant jusqu'à 400G/800G. Grâce à la fiabilité du DSP Broadcom, à la faible consommation d'énergie et à la conformité aux normes industrielles telles que l'OSFP MSA, les modules et câbles IB de FS garantissent une transmission de données efficace et stable, minimisant ainsi les pertes dues aux interruptions d'activité.

FS NVIDIA® InfiniBand Network Products

La gamme de périphériques InfiniBand de FS peut être associée aux serveurs GPU NVIDIA H100 pour construire des réseaux informatiques de centre de données hautement performants, fiables et évolutifs. Ce réseau informatique InfiniBand H100 n'est pas seulement adapté aux charges de travail HPC, mais prend également en charge diverses tâches informatiques intensives telles que le calcul à haute performance, l'apprentissage automatique et l'analyse de données massives (big data).

InfiniBand Network

Gestion fiable du réseau grâce à une plate-forme de réseau unifié de premier plan

Pour les réseaux complexes de centres de données axés sur le HPC, FS intègre de manière transparente le logiciel PicOS® et le contrôleur de réseau AmpCon™ afin d'automatiser la gestion du cycle de vie du réseau de bout en bout. Cela rationalise la configuration et le déploiement du réseau, garantissant une allocation et une utilisation efficaces des ressources pour des opérations de réseau HPC plus résilientes et plus rentables.

Le logiciel PicOS® de FS offre ouverture et flexibilité, permettant aux clients de configurer des réseaux hautement élastiques, fiables et programmables adaptés à leurs besoins. Prenant en charge un large éventail de protocoles, notamment MLAG, EVPN-VXLAN, Ansible, ACL, API et RADIUS, le logiciel PicOS® constitue un système de gestion de réseau robuste pour les centres de données HPC.

FS PicOS® Software

Le contrôleur de réseau AmpCon™ est une plateforme unifiée pour la gestion des réseaux, qui automatise le provisionnement zéro touche (ZTP), le déploiement, la configuration et la gestion du cycle de vie des switchs logiciels PicOS®. Grâce à des API ouvertes et à la prise en charge de flux de travail personnalisés à l'aide de playbooks Ansible, AmpCon™ permet une automatisation puissante et sans agent, améliorant ainsi l'efficacité et l'agilité opérationnelles.

FS PicOS® & AmpCon™ Network Platform

Architecture de réseau optimisée pour l'évolutivité

La solution InfiniBand FS H100 utilise une architecture Spine-Leaf, qui répond aux besoins opérationnels actuels du réseau tout en offrant flexibilité et fiabilité pour les futures expansions des centres de données HPC. Cette architecture est à la fois simple et modulaire, ce qui facilite l'évolutivité rapide en fonction des besoins. L'ajout de commutateurs spine supplémentaires augmente facilement la capacité du réseau, et l'insertion transparente de nouveaux switchs leaf améliore la densité des ports sans nécessiter de modifications majeures de la structure du réseau existant.

Pourquoi choisir la solution FS pour le centre de données HPC ?

Outre ses solutions rentables adaptées aux charges de travail HPC, FS se distingue par sa présence mondiale, ses capacités professionnelles en matière de R&D, sa logistique efficace et son assistance locale, qui garantissent le fonctionnement stable et sans heurts des centres de données HPC dans le monde entier.

Recherche et développement professionnels

Avec un centre de R&D de classe mondiale comprenant plus de 400 experts, FS mène des recherches, des conceptions et des tests rigoureux afin de garantir les normes de qualité les plus élevées. S'appuyant sur des années d'expertise en matière de solutions et sur des installations et équipements de laboratoire de premier ordre, FS fournit des services complets, notamment en matière de développement de logiciels, de personnalisation et de conception industrielle.

Professional Research and Development

Personnalisation de la solution réseau

FS peut fournir des solutions sur mesure pour les centres de données HPC de ses clients, en gérant efficacement les coûts des projets et en réalisant des configurations précises en fonction des exigences budgétaires des clients.

Découvrez comment FS personnalise des solutions qui répondent aux besoins difficiles des réseaux avec l'essor du HPC. Cliquez ici.

Network Solution Customization

Des entrepôts mondiaux pour une livraison rapide

Avec plus de 50 000 mètres carrés d'entrepôts couvrant plus de 200 pays, FS garantit une livraison dans les délais. Plus de 90 % des commandes sont expédiées le jour même, et les services d'entreposage locaux facilitent les enlèvements, tandis que les services de pièces détachées raccourcissent les délais de résolution des pannes. La livraison rapide des produits raccourcit les cycles des projets des clients, ce qui permet un déploiement rapide des activités et aide les clients à conquérir rapidement le marché du calcul intensif.

Global Warehouses for Rapid Delivery

Des services localisés pour des opérations stables

FS propose des services localisés complets, notamment des études, des installations et des dépannages sur site. Ces services s'étendent aux États-Unis, à l'Europe et à Singapour, ce qui permet aux clients d'économiser sur les coûts d'installation. Grâce aux opérations en ligne à distance, les professionnels de FS identifient et résolvent rapidement les problèmes techniques dans un délai de 12 heures, ce qui réduit considérablement les temps d'arrêt du système.

Localized Services for Stable Operations

La dernière réflexion

De la haute évolutivité des réseaux aux performances en temps réel et à la faible latence, les centres de données ont été poussés vers de nouvelles frontières pour répondre aux exigences des charges de travail HPC. Tout au long de l'évolution des centres de données, FS s'est imposé comme un acteur clé, fournissant des solutions de centres de données HPC sur mesure à des entreprises de renom, et les aidant à franchir des étapes importantes dans la transformation numérique à l'ère du HPC.

Alors que les industries du monde entier continuent d'adopter les technologies HPC, FS reste déterminé à fournir des solutions de pointe qui permettent aux clients de prospérer à l'ère de l'intelligence et de la transformation numérique.

Articles connexes :

FAQ sur la Technologie NVIDIA Quantum-2 InfiniBand

Aperçu de l'InfiniBand : L'Informatique Haute Performance à l'Ère du Numérique

Que Savez-Vous de l'Informatique en Réseau InfiniBand ?

Comment l'Informatique HPC Stimule-t-elle le Développement de Modules Optiques 800G ?

Cela pourrait également vous intéresser

Connaissances
Connaissances
Connaissances
See profile for Migelle.
Migelle
Switch PoE, PoE+ ou PoE++ : Lequel choisir ?
25 août, 2021
49.0k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre LACP et PAGP ?
29 déc, 2021
17.7k
Connaissances
See profile for Migelle.
Migelle
Switch PoE actif ou passif : lequel choisir ?
28 févr, 2022
20.6k
Connaissances
See profile for Vincent.
Vincent
Comprendre le transceiver bidirectionnel BiDi
05 janv, 2022
9.9k
Connaissances
See profile for Moris.
Moris
Câbles à fibre optique Simplex ou Duplex
25 nov, 2018
18.4k
Connaissances
See profile for Sheldon.
Sheldon
Quelle est la différence entre RIP et OSPF ?
10 juin, 2021
24.0k