800G光トランシーバーでデータセンターに革命を起こす
データセンター向け800G光トランシーバー急増の原動力とは?
先端技術の台頭は、さまざまな業界、特に光トランシーバ市場に変革が起こっています。ディープラーニング技術を搭載したChatGPTのようなAIモデルは、データセンターネットワークを再構築し、より高速で信頼性が高く、大容量の光トランシーバの必要性を高めています。これらの技術が通信を強化し、データ処理を合理化し続けるにつれて、2024年に予想される800G光トランシーバの急増の主要因となっています。
ChatGPTのようなモデルの運用には、かなりのクラウド・コンピューティング・リソースが必要です。例えば、1750億のパラメータを持つGPT-3は、トレーニング中に45TBのデータと約3640PF日の計算能力を必要としました。ChatGPTの現在のユーザーベースをサポートするだけでも、コンピューティング・インフラに推定30~40億ドルの投資が必要であり、この技術の波を維持する上で高性能光トランシーバの重要な役割が浮き彫りになっています。
HPCはどのようにデータセンターネットワークを再構築するか
HPCをデータセンターに統合することで、データ転送の状況を再定義しました。従来のコンピューティング ワークロード向けに設計された従来のデータセンターは、HPC主導のアプリケーションの需要を満たすために変革を遂げています。主な差別化要因は、データの処理方法と転送方法にあります。
従来のデータセンターとHPCデータセンターの比較
従来のデータセンターでは、データは階層的なネットワーク・アーキテクチャを流れ、各レイヤーに遅延や潜在的なボトルネックが発生します。 当初、データセンターはアクセス層、アグリゲーション層、コア層からなる伝統的な3層モデルを採用していました。アクセス層はコンピューティング・ノードをキャビネット・スイッチにつなぎ、アグリゲーション層はアクセス層間の相互接続を促進し、コア層はアグリゲーション層と外部ネットワークとの接続を管理しました。
しかし、データセンター内の東西トラフィック量が急速に増加するにつれ、3層ネットワークアーキテクチャのコア層とアグリゲーション層は、増大するタスクとより高いパフォーマンス要件に直面し、その結果、設備コストが大幅に上昇しました。その結果、東西トラフィック用に調整された、より合理的なリーフスパイン・ネットワーク・アーキテクチャーが登場しました。このアーキテクチャでは、リーフスイッチはコンピュートノードへの直接接続を確立し、スパインスイッチはコアスイッチとして機能し、ECMP(Equal-Cost Multipath)により複数のパスを動的に選択します。
リーフスパインネットワークアーキテクチャには、高い帯域幅利用率、優れたスケーラビリティ、予測可能なネットワーク遅延、強化されたセキュリティなど、いくつかの利点があります。これらの機能により、さまざまなデータ センター シナリオでの導入に広く適用でき、有利になります。
一方、HPCデータ センターでは、並列処理、分散コンピューティング、高速相互接続を活用して、シームレスなデータフローと最小限のレイテンシを実現します。内部データトラフィックが膨大であるため、ブロックされていないファットツリー ネットワークアーキテクチャの必要性が極めて重要になっています。NVIDIAのHPCデータ センターでは、ブロックされていない機能を確保するためにファットツリーネットワークアーキテクチャを採用しています。
その背後にある基本的な考え方は、多数の低パフォーマンススイッチを利用して、ブロックされていない広範なネットワークを構築することです。この設計により、あらゆる通信パターンに対して、通信帯域幅がネットワークインターフェイスカード(NIC)の帯域幅と一致するパスが確保され、アーキテクチャ内のすべてのスイッチが同一になります。ファットツリーネットワークアーキテクチャは、ネットワーク要件が厳しいデータセンター、特に高性能コンピューティングセンターやHPCデータセンターで広く使用されています。
NVIDIAのDGX A100 SuperPOD HPCデータセンターシステムを例に挙げると、3層スイッチはすべてNVIDIA Quantum QM879040ポートスイッチで構成されています。第1層スイッチは、1120個のMellanox HDR 200G InfiniBand NICにリンクされています。このセットアップでは、第2層スイッチのダウンリンクポートは第1層スイッチに接続され、アップリンクポートは第3層スイッチに接続されます。第3層スイッチはダウンリンク ポートのみを備え、第2層スイッチと相互接続されています。
さらに、システムのストレージ側では、コンピューティング側とは別の、独自のネットワークアーキテクチャが採用されています。この分離には、特定の数のスイッチと光トランシーバーが必要です。したがって、従来のデータ センターと比較すると、HPCデータ センターのスイッチと光トランシーバーの数は大幅に増加しています。
詳細については、HPCデータセンターの台頭: FSが次世代データセンターを強化をご覧ください。
800G光トランシーバが重要な役割を果たす
800G光トランシーバは、この変革において極めて重要な役割を果たします。光ポートの1つの800G光トランシーバは、2つの400G光トランシーバを置き換えることができます。さらに、電気ポートでは、光ポートの8つの100Gチャネルに合わせて8つのSerDesチャネルを統合できます。この設計により、スイッチのチャネル密度が向上し、物理的なサイズが大幅に縮小されます。
光トランシーバーの速度はネットワーク カードの影響を受け、ネットワークカードの速度はPCIeチャネルの速度によって制限されます。NVIDIAのA100 DGXサーバーでは、内部接続はNVLink3を介して行われ、一方向の帯域幅は300GB/秒です。ただし、A100 GPUは16個のPCIe 4.0チャネルを介してConnectX-6ネットワークカードにリンクし、合計帯域幅は約200Gになります。したがって、ネットワークカードの200Gの帯域幅に合わせるには、200G光トランシーバーまたはDACケーブルが必要です。.
H100 DGXサーバーの場合、内部接続には450GB/秒の単方向帯域幅を持つNVLink4が使用されます。H100 GPUは16個のPCIe 5.0チャネルを介してConnectX-7ネットワークカードに接続され、個々のネットワークカードの合計帯域幅は約400Gになります。特に、光トランシーバーの速度は、ネットワークカードとGPU間のPCIe帯域幅によって影響を受けます。
A100およびH100 DGXサーバーの内部PCIeチャネル速度が800G(PCIe 6.0)に達すると、800G帯域幅のネットワークカードを導入し、800G光トランシーバーを採用することが可能になります。この進歩により、システムの計算効率が大幅に向上する可能性があります。
2024 — 800G光トランシーバの年
今後、2024年は光トランシーバー市場にとって重要な年となり、800Gソリューションに注目が集まります。2019年は100G光トランシーバーへの移行の時期とされ、市場には200Gと400Gの2つのアップグレードパスが提示されました。ただし、市場における次世代の高速光トランシーバーは、800G光トランシーバー専用です。AIとGC(一般化畳み込み)ネットワークによって推進される計算能力と競争の激化と相まって、北米の大手クラウドプロバイダーとテクノロジー大手は2024年に800G光トランシーバーを大幅に買収する可能性が高いと予想されます。
この変革の環境の中で、信頼できる革新的なパートナーを持つことは非常に重要です。FSは、信頼できるネットワークソリューションプロバイダーとして、世界中の超大規模クラウドデータセンター向けに設計された完全な800Gポートフォリオを提供しています。2023年には、新しいシリーズの800G NDR InfiniBandソリューションを発表しました。当社の製品範囲には、800G OSFPと800G QSFP-DDの両方の光トランシーバータイプが含まれます。FSは、製品ラインを拡張して800G AOCとDACも含めます。これにより、さまざまな業界のお客様へのサポートが拡大し、最高レベルの信頼性の高い光ネットワーク製品とソリューションを継続的に提供できるようになります。
結論
結論として、HPCの進歩と光トランシーバー市場の融合は、高速で効率的なデータ伝送の新時代の到来を告げています。HPCがデータセンターネットワークに与える変革的な影響は、光トランシーバーの極めて重要な役割を強調しています。800G光トランシーバーの年である2024年が予想される中、企業は常にFSを頼りにHPC時代の複雑さを乗り越え、無限の可能性を秘めた未来への道を開く、回復力のある高性能ネットワークを構築することができます。FSが、当社の高度な800G光トランシーバーを使用して、将来を見据えたHPCデータ センター の構築にどのように役立つかをご覧ください。今すぐ詳細をご確認ください。
お勧めの記事
メールアドレス
-
レイヤ2(L2)スイッチとレイヤ3(L3)スイッチ、ルーターとの違いは?
2022年06月20日
-
電源コードの種類・規格について:国内規格と海外規格の選定
2022年06月09日
-
ハブ、スイッチとルーターの違いをわかりやすく解説
2024年08月29日
-
T568AとT568B:ストレートケーブルとクロスケーブルの違い
2022年06月30日
-
PoEインジェクター(パワーインジェクター)とは?
2022年06月24日