Pourquoi la Technologie AIGC Nécessite-t-elle du Calcul Haute Performance ?

Publié le 26 mars, 2024 by

 98

Les grands modèles AIGC représentés par ChatGPT et GPT1-4 ont démontré de solides capacités de production de contenu et ont grandement choqué les gens. Quel type de réseau puissant soutient le fonctionnement de l’AIGC ? De plus, quels types de changements la vague de l’IA apportera-t-elle aux réseaux traditionnels ?

AIGC

Introduction

La technologie de l'intelligence artificielle et du calcul en nuage (AIGC) connaît une croissance exponentielle dans divers domaines tels que l'analyse de données, la vision par ordinateur et l'apprentissage automatique. Cependant, pour exploiter pleinement le potentiel de l'AIGC, il est essentiel de disposer de suffisamment de puissance de calcul. Dans cet article, nous explorerons pourquoi la technologie AIGC nécessite une puissance de calcul élevée et comment les solutions telles que NVIDIA InfiniBand peuvent répondre à ces exigences.

Les grandes entreprises ont annoncé qu'elles soumettraient les procès-verbaux des réunions de recherche sur les performances et les investissements. Que s’est-il passé pour provoquer une telle sensation ?

Demande de Puissance de Calcul de la Technologie AIGC

Comme nous le savons tous, les données, les algorithmes et la puissance de calcul sont les trois éléments fondamentaux du développement de l’intelligence artificielle.

L'une des principales raisons pour lesquelles la technologie AIGC nécessite une puissance de calcul élevée est la complexité des modèles d’apprentissage automatique.

Ces modèles nécessitent des millions, voire des milliards de calculs pour analyser et traiter les données afin de produire des résultats précis. Des tâches telles que le traitement du langage naturel, la reconnaissance d'images et la prédiction nécessitent également une puissance de calcul importante pour des performances optimales.

Les nombreux grands modèles AIGC mentionnés précédemment sont si puissants non seulement parce qu’ils contiennent une quantité massive de données, mais également parce que les algorithmes évoluent et se mettent à niveau constamment. Plus important encore, la puissance de calcul humaine s’est développée dans une certaine mesure. La puissante infrastructure informatique peut pleinement répondre aux besoins informatiques de l'AIGC.

Avec le développement de l’AIGC, les paramètres du modèle de formation sont passés de centaines de milliards à des milliards. Afin de réaliser une formation à si grande échelle, le nombre de GPU pris en charge par la couche sous-jacente a également atteint l'échelle de 10 000 cartes.

En prenant ChatGPT comme exemple, ils ont utilisé l'infrastructure de supercalcul de Microsoft pour la formation. On dit que 10 000 GPU V100 ont été utilisés pour former un cluster à large bande passante. Une formation nécessite environ 3 640 jours-PF de puissance de calcul (soit 1 quadrillion de calculs par seconde, s'exécutant pendant 3 640 jours). La puissance de calcul et l'utilisation du GPU ont un impact important sur la formation de grands modèles.

Quel est le Principal Facteur Affectant l’Utilisation du GPU ?

Dix mille, voire dizaines de milliers de GPU, en tant que cluster informatique, nécessitent une énorme quantité de bande passante pour interagir avec le cluster de stockage. De plus, lorsque le cluster GPU effectue des calculs d’entraînement, ceux-ci ne sont pas indépendants, mais mixtes et parallèles. Il existe un grand nombre d’échanges de données entre les GPU, ce qui nécessite également une bande passante énorme.

Si le réseau est faible et que la transmission des données est lente, le GPU devra attendre les données, ce qui entraînera une utilisation réduite. À mesure que l’utilisation diminue, le temps de formation augmentera, les coûts augmenteront et l’expérience utilisateur se détériorera.

Plus la capacité de débit du réseau est élevée, plus l'utilisation du GPU est élevée ; plus le délai dynamique de communication est grand, plus l'utilisation du GPU est faible. En un mot, sans un bon réseau, former de grands modèles sera très difficile.

Quel type de réseau peut soutenir le fonctionnement de l’AIGC ?

Le Potentiel Énorme d'InfiniBand

Le réseau InfiniBand présente les caractéristiques d'une bande passante extrêmement élevée, d'aucune congestion et d'une faible latence, et constitue actuellement le meilleur choix pour construire des réseaux hautes performances. Bien que le coût soit relativement élevé, il est adopté par des modèles tels que ChatGPT et GPT-4. Grâce à InfiniBand et aux GPU, NVIDIA a établi une position dominante dans l'infrastructure d'IA avec environ 80 % de part de marché.

Produits InfiniBand

Switchs InfiniBand

Les switchs InfiniBand sont vitals pour diriger les données au sein des réseaux InfiniBand, ces commutateurs assurent une transmission de données à haut débit au niveau de la couche physique. FS propose des commutateurs HDR 200Gb/s et NDR 400Gb/s avec une latence inférieure à 130ns. Il peut offrir une solution d'interconnexion avancée qui offre un haut débit, une latence extrêmement faible et une évolutivité, stimulant ainsi la recherche, l'innovation et le développement de produits pour les développeurs d'IA et les chercheurs scientifiques. Elle garantit la continuité des activités grâce à une protection matérielle contre les pannes.

Adaptateurs InfiniBand

Servant de cartes d'interface réseau (NIC), les adaptateurs InfiniBand permettent aux appareils de se connecter aux réseaux InfiniBand. FS propose des cartes ConnectX-6 et ConnectX-7, offrant des performances et une flexibilité optimales pour répondre aux demandes évolutives des applications de centre de données.

ConnectX-7 permet de mettre en œuvre des solutions agiles et performantes, des centres de données edge-to-core aux clouds, tout en renforçant la sécurité du réseau et en réduisant le coût total de possession.

Avec toutes les fonctionnalités innovantes des versions précédentes ainsi que de nombreuses améliorations visant à améliorer encore les performances et l'évolutivité, les cartes ConnectX-6 constituent la solution la plus performante et la plus flexible pour répondre aux demandes croissantes des applications de centres de données.

Émetteurs-récepteurs et Câbles InfiniBand

Le backbone des réseaux InfiniBand repose sur des émetteurs-récepteurs et des câbles pour le transfert de données à haut débit. FS propose une gamme d'émetteurs-récepteurs et de câbles DAC/AOC, notamment des options 40G, 56G, 100G, 200G, 400G et 800G. L'utilisation de la technologie du cuivre actif améliore l'intégrité du signal et minimise les pertes sur différentes distances.

Solution InfiniBand FS

Les solutions FS InfiniBand offrent une excellente bande passante, une faible latence et une fiabilité, aidant vos projets à dépasser les limites et à atteindre des performances exceptionnelles et des avancées innovantes. Qu'il s'agisse d'apprentissage automatique, d'intelligence artificielle ou de traitement de données à grande échelle, InfiniBand est le choix judicieux pour votre prise de décision. En savoir plus : Boostez le HPC par la Solution de Modules et de Câbles InfiniBand de FS.

Et en un clic, vous pouvez concever votre propre solution dès maintenant : Support de Solution.