中文

为高性能计算(HPC)选择InfiniBand产品的建议

更新于 2024年03月01日 by
298

在Computex 2023期间,英伟达(NVIDIA )推出了一系列先进的产品,包括先进的芯片、超级计算架构和复杂的交换机。特别值得关注的是强大的超级计算机NVIDIA Helios。它利用Quantum-2 InfiniBand网络,准确地连接四台DGX GH200系统,极大地提升大规模模型训练的效率。

各种指标表明,数据中心正在向加速计算发生决定性转变,这一趋势是由高性能计算(AIGC)推进的。为了满足高性能计算和庞大基础设施不断增长的需求,对加速互连和更智能的网络解决方案的需求随之增长。在这一背景下,InfiniBand产品因能满足这些迫切需求已成为行业关注的焦点。

InfiniBand的基础知识

InfiniBand是一种高速、低延迟的互连技术,主要用于数据中心和高性能计算(HPC)环境。它提供了一个高性能结构,用于连接集群或数据中心内的服务器、存储设备和其他网络资源。InfiniBand技术的出现与传统TCP/IP协议相关的大量网络延迟和额外的操作系统成本密切相关。

InfiniBand

传统的TCP协议是一种被广泛应用的传输协议,其应用范围从冰箱等日常电器到复杂的超级计算机等一系列设备。然而,其应用常伴随着巨大的成本,原因为TCP协议复杂多变,代码庞大,异常繁多,且难以卸载。

InfiniBand

相比之下,InfiniBand采用基于信任的流量控制机制,能够确保连接完整性并尽可能减少数据包丢失。在InfiniBand环境下,只有当接收缓冲区有足够的空间时,才会进行数据传输。数据传输完成后,接收方会发出缓冲空间的可用信号,从而消除与初始数据包丢失相关的重传延迟。这种方法显著提升了效率和整体性能。

市场上的InfiniBand

InfiniBand技术是在InfiniBand贸易协会(IBTA)的监督下开发的,该协会专门负责维护和推广InfiniBand标准。此外,InfiniBand贸易协会还确保合规性,并对商业InfiniBand产品进行互操作性测试。在InfiniBand贸易协会的九位主要董事中,只有两家公司——迈络思(Mellanox )和Emulex——致力于InfiniBand。由于经营业绩不佳,Emulex于2015年被Avago收购。目前,迈络思(Mellanox )在InfiniBand市场占据主导地位,其产品的集群部署数量远远超过其竞争对手。

InfiniBand的主要优势

总体而言,InfiniBand技术具有以下优势:

  • 高速和可扩展性

  • 低延迟

  • 低功耗

有关InfiniBand的更多信息,请参阅:InfiniBand见解:在数字时代推动高性能计算

高性能计算(HPC)网络中的InfiniBand

在高性能计算(HPC)领域,高速互连网络(HSI)在系统性能和效率方面发挥着至关重要的作用。其中,InfiniBand技术凭借其优良的性能,已成为高性能计算中广泛应用的关键组件。作为提升效果显著的高速互联网络技术之一,InfiniBand能够提供高达200Gbps的带宽和小于0.6ms的点对点延迟,为构建高性能计算集群提供了强大的支持。

借助InfiniBand的高速组网能力,高性能计算系统可以有效地组合多台服务器,实现线性性能可扩展性。该技术在高性能计算集群的开发中起着重要的作用,特别是在超级计算机的构建中。企业以及大型或超大型数据中心都受益于其高可靠性、可用性、可扩展性和卓越性能。因此,InfiniBand技术在高性能计算领域的重要性不仅体现在提升计算集群的性能上,还体现在为不同规模的数据中心提供关键支撑,推动高性能计算生态系统的整体发展。

市场上的InfiniBand产品销售商

迈络思(Mellanox ) (被英伟达(NVIDIA )收购)

迈络思(Mellanox )是InfiniBand(IB)领域的领先企业,于2020年4月被英伟达(NVIDIA )收购。迈络思(Mellanox )产品的官方购买平台是英伟达(NVIDIA )官网店铺。这家网店高效可靠,提供各种连接器。但是,某些产品可能无法在官方网站上直接获得。如果官方网站上没有产品,客户可以选择从英伟达(NVIDIA )合作伙伴处购买。

英伟达(NVIDIA )合作伙伴网络

英伟达(NVIDIA )的合作伙伴是时下市场解决方案和产品的主要供应商,包括InfiniBand线缆和光模块。InfiniBand线缆和光模块通过英伟达(NVIDIA )授权分销商/经销商网络在全球范围内分销。有关分销商/经销商的信息可以在英伟达(NVIDIA )官方网站上找到。尽管分销商/合作伙伴与英伟达(NVIDIA )之间合作密切,仍可能会出现连接器短缺、市场供应不足和交货周期长等问题。

飞速(FS)

飞速(FS)是英伟达(NVIDIA )的精英合作伙伴,在其官网上提供了丰富的InfiniBand产品,包括英伟达(NVIDIA )InfiniBand交换机、InfiniBand模块InfiniBand线缆英伟达(NVIDIA)InfiniBand网卡 。飞速(FS)拥有充足的InfiniBand产品库存,并确保快速交付。如果您想购买InfiniBand产品或获取InfiniBand解决方案,可以联系飞速(FS)寻求帮助。

选择InfiniBand产品的建议

InfiniBand产品在高性能计算数据中心中发挥着至关重要的作用,选择合适的产品对于运营成功至关重要。全面的InfiniBand系统包括InfiniBand交换机、InfiniBand网卡、InfiniBand以太网网关、InfiniBand线缆和光模块、InfiniBand遥测和软件管理以及InfiniBand加速软件。

选择合适的InfiniBand产品对于高性能计算数据中心至关重要。考虑包括带宽和距离要求、连接器、预算、兼容性、可靠性和未来需求在内的因素能够有助于选择合适的InfiniBand连接器。

InfiniBand连接器

关于InfiniBand网络互连产品:

  • DAC高速铜缆为短距离、高速互连提供了经济的解决方案。

  • AOC有源光缆利用光学技术进行更远距离的数据传输。

  • 光模块通常用于长距离、高速互连。

了解不同的产品品类、速度和封装模块有助于做出明智的决策,而选择合适的供应商可确保获得符合性能和预算要求的高质量InfiniBand产品。

InfiniBand或以太网:InfiniBand更适合HPC计算

InfiniBand

一些用户仍然对在HPC计算能力中使用InfiniBand还是以太网有疑问。实际上,对于高性能计算,InfiniBand更合适。

在高性能计算(HPC)领域,InfiniBand在几个关键方面表现出优于以太网的优势:

流量控制机制

InfiniBand采用端到端的流量控制,确保消息在传输过程中不会拥塞,从而实现无损网络。相比之下,以太网的流量控制机制相对简单,可能导致拥塞和数据丢失。

网络拓扑优势

InfiniBand在其第2层网络中引入了一个子网管理器,能够配置节点的本地ID并通过控制平面计算/分发转发路径信息。这有助于轻松部署大规模网络,避免泛洪、VLAN或环路中断问题。这为以太网上的InfiniBand带来了独特的优势。

性能参数

InfiniBand提供更高的带宽、更低的延迟和更少的抖动,使其成为HPC环境中快速可靠数据传输的理想选择。与以太网相比,InfiniBand拥有更快的数据传输速率,从40G到400G,而以太网目前仅限于100G。

GPU工作负载的适用性

InfiniBand更适合处理GPU工作负载,从而实现CPU和GPU之间的高速数据传输。这对于需要大量计算能力的任务尤为重要,因为以太网这这方面表现较弱。

支持并行计算

InfiniBand允许多个处理器同时通信,展示了并行计算的优良性能。这对于需要大量并行计算能力的应用至关重要。

全球HPC TOP500排行榜

根据近来的全球HPC TOP500排行榜,InfiniBand的市场份额一直在稳步上升,目前在TOP100中占据主导地位,而以太网的市场份额则在下降。

InfiniBand

结论

目前,我们正处于通用计算(AIGC)蓬勃发展的时代。OpenAI、Microsoft和Google等主要平台巨头,以及Midjourney和Character Al等专注于应用程序的公司,正在加速应用程序和服务的开发和演进。此外,新公司和新应用的迅速涌现在HPC领域营造出高度竞争的氛围。

显而易见,计算能力在决定生产力方面发挥着至关重要的作用。目前,英伟达(NVIDIA )InfiniBand产品明显供不应求。为满足您企业的业务需求,选择合适的供应商和InfiniBand产品至关重要。

相关文章推荐

技术博文
See profile for Jesse.
Jesse
光分路器光衰多少,如何计算和测量?
2022年01月25日
14.9k
技术博文
技术博文
See profile for Audrey.
Audrey
FTTH网络应如何设计分层与分光比?
2022年01月25日
3.8k
技术博文
技术博文
技术博文
See profile for Audrey.
Audrey
揭秘光分路器类型及选择
2022年01月24日
3.4k
技术博文
See profile for Audrey.
Audrey
一文教您认识光分路器
2022年01月24日
4.9k
技术博文
See profile for Jesse.
Jesse
家庭网络怎么布线?家用网线布线指南
2021年12月31日
1.9k
技术博文
公司新闻
See profile for George.
George
关于飞速(FS)800G光模块的技术问答
2024年05月16日
41
技术博文
See profile for Audrey.
Audrey
数据中心预端接主干铜缆解决方案
2021年12月31日
1.8k