InfiniBand网络:探究其特性、组件与优势
InfiniBand是一种开放标准,旨在实现CPU/GPU服务器、存储服务器以及其他设备之间的高性能连接。本文将深入探讨InfiniBand网络的基本要素,包括其结构组成、核心功能以及相较于传统以太网解决方案的优势。
什么是InfiniBand?
InfiniBand是一种面向工业应用的开放标准,它定义了一种高速网络,用于互连服务器、存储设备等多种硬件设施。通过采用点对点双向链接技术,InfiniBand使得位于不同服务器上的处理器能够实现无缝通信。同时,InfiniBand兼容多种操作系统,如Linux、Windows和ESXi等。
InfiniBand网络的结构组件
一个InfiniBand网络由以下组件构成:
主机通道适配器(HCA)
HCA,也称为网络接口卡,作为连接至InfiniBand网络的端节点存在。它负责传输层功能,并支持 verbs 接口,该接口为InfiniBand设备提供了编程接口。 InfiniBand与以太网网关/桥接器
InfiniBand to Ethernet Gateway/Bridge
此类设备能够实现InfiniBand和以太网消息之间的转换,在必要时允许InfiniBand网络与以太网网络之间进行通信。
InfiniBand交换机
InfiniBand交换机负责在InfiniBand网络之间转发消息,从而实现连接设备间高效的数据传输。
子网管理器(SM)
子网管理器负责管理InfiniBand子网。它可以运行在主机上、交换机上,或者与统一结构管理器(Unified Fabric Manager, UFM)一同部署,以实现全面的管理功能。
InfiniBand路由器
InfiniBand路由器则有助于不同InfiniBand子网之间的消息传输。
InfiniBand的核心特性
-
子网管理器(SM): 子网管理器程序确保了集中化的路由管理,从而在全网络节点上实现即插即用功能。每个子网需要一个主SM,而其他SM则处于备用模式。
-
GPU Direct: GPU Direct允许GPU之间直接进行数据传输,减少延迟并提升性能,特别是在基于GPU的计算中尤为显著。NVIDIA GPU还支持计算任务卸载。
-
低延迟:InfiniBand通过硬件卸载和加速机制实现了极低的延迟。其交换机中的直通转发模式可将传输延迟降低至130ns以内。RDMA(远程直接内存访问)技术进一步降低了端到端传输延迟。
-
网络可扩展性:通过使用InfiniBand路由器,InfiniBand能够将多个子网互联,轻松实现扩展以容纳超过48,000个节点。
-
容错稳定网络: 得益于子网管理器的路由算法和高效流重排序机制,InfiniBand网络确保了快速的数据流量恢复,从而形成高容错稳定的网络环境。
-
自愈网络: NVIDIA IB交换机具有基于硬件的自愈机制,能够在一毫秒内实现快速恢复。
-
自适应路由: 自适应路由可以平衡交换机端口间的流量分配。NVIDIA交换机在硬件中集成了这一特性,并通过自适应路由管理器对其进行管理。
-
SHARP(可扩展分层聚合和减少协议): 基于NVIDIA交换机硬件和中心管理包的SHARP协议优化了集体通信,在AI、机器学习等基于MPI的应用中减少了节点间的数据传输量。
相比于以太网,InfiniBand的优势
InfiniBand相较于传统的以太网网络解决方案具有多项优势,使其在需要高速通信和大规模数据传输的应用中表现出色。InfiniBand的优点包括:
-
高带宽与低延迟:InfiniBand提供了更高的带宽和更低的延迟,能够满足大规模数据传输和实时通信应用的性能需求。
-
RDMA支持:InfiniBand支持远程直接内存访问(RDMA),允许节点间直接进行内存数据传输,从而减少CPU开销并提高传输效率。
-
可扩展性: InfiniBand架构通过连接大量节点并支持高密度服务器布局,实现了轻松扩展。增加InfiniBand交换机和电缆即可扩大网络规模和带宽容量。
-
高可靠性: InfiniBand架构融入了冗余设计和故障隔离机制,提高了网络可用性和容错能力。备用路径能够在节点或连接发生故障时保持网络连通性。
飞速(FS) InfiniBand解决方案
序号 | 类型 | |
1 | 光模块/DAC/AOC | 800G NDR InfiniBand |
2 | 400G NDR InfiniBand | |
3 | 200G HDR InfiniBand | |
4 | 100G EDR InfiniBand | |
5 | 56/40G FDR InfiniBand | |
6 | NICs | NVIDIA® InfiniBand 适配器 |
7 | 交换机 | NVIDIA® InfiniBand 交换机 |
飞速(FS)解决方案充分利用了InfiniBand前沿的网络技术,赋予用户强大的高性能计算能力。针对不同应用和用户需求定制解决方案,优化性能表现,提供高带宽、低延迟以及流畅的数据传输服务。
通过与飞速(FS)合作并部署稳定的InfiniBand网络,您将能够开启新的机遇,加速业务增长,并全面提升用户体验!
相关文章推荐
邮箱地址
-
Cat5e、Cat6、Cat6a和Cat7网线有什么区别?哪个更好?
2020年08月21日
-
一文带你了解SFP、SFP+、SFP28、QSFP+和QSFP28之间的区别
2024年04月13日
-
OM1、OM2、OM3、OM4和OM5多模光纤有什么区别?
2021年11月24日
-
SFP端口是什么?有什么作用?可以接RJ45吗?
2020年09月15日
-
QSFP-DD封装有何优势?800G光模块是否会沿用QSFP-DD封装?
2020年10月16日