Italia

Costruire l'Architettura di Rete del Data Center HPC con la Soluzione FS InfiniBand

Inviato il 24 Mag 2024 by
82

Nel panorama in continua evoluzione del calcolo ad alte prestazioni, la spina dorsale del futuro sviluppo del business HPC risiede nelle reti e nelle infrastrutture HPC. Con l'aumento della complessità e del volume di dati delle applicazioni HPC, la richiesta di reti resilienti, scalabili ed efficienti diventa imperativa. L'architettura delle reti HPC funge da base per le operazioni del sistema HPC, svolgendo un ruolo fondamentale nell'elaborazione dei dati, nella gestione e nello storage su larga scala. Questo articolo approfondisce i componenti chiave dell'architettura di rete HPC, illustra i vantaggi della rete dei data center HPC ed esplora la soluzione completa di FS con prodotti estesi per le diverse partizioni dell'architettura di rete dei data center HPC.

Qual è l'architettura di rete HPC e i suoi componenti chiave?

L'architettura di rete per i carichi di lavoro HPC è progettata meticolosamente e comprende tre componenti chiave: rete di calcolo, rete di gestione e rete di archiviazione. Questi componenti collaborano per affrontare gli algoritmi più complessi, liberando nuove potenzialità in vari settori.

Rete di Calcolo

La rete di calcolo funge da spina dorsale computazionale dei sistemi di rete HPC, costituita da reti di calcolo HPC e reti di calcolo generiche.

Le reti di elaborazione HPC sono progettate per attività HPC ad alte prestazioni e sono in grado di elaborare in modo efficiente grandi volumi di dati e di eseguire attività che richiedono calcoli complessi, come il riconoscimento delle immagini, l'elaborazione del linguaggio naturale e l'inferenza di modelli. Le reti di elaborazione HPC comprendono in genere server GPU, switch ad alte prestazioni, moduli ad alta velocità e cavi DAC/AOC di alta qualità, formando grandi cluster di rete di elaborazione che collaborano per accelerare i carichi di lavoro HPC e fornire approfondimenti in tempo reale. Il cluster di calcolo HPC presenta le caratteristiche più esigenti in termini di prestazioni, poiché funge da spina dorsale per l'elaborazione dei carichi di lavoro HPC e richiede una rete con prestazioni elevate, trasmissione senza perdite, bassa latenza e scalabilità. Per questo motivo, le reti di calcolo HPC sono tipicamente costituite da connessioni a 400G o superiori e utilizzano potenti tecnologie di rete, come l'interconnessione InfiniBand.

Le reti di calcolo general-purpose gestiscono principalmente il traffico di applicazioni generali, offrendo risorse di calcolo versatili essenziali per le reti HPC, come le piattaforme di deep learning e altri software. Forniscono un ambiente di elaborazione flessibile in grado di ospitare diversi carichi di lavoro e applicazioni, ad eccezione delle attività di elaborazione ad alta intensità di dati per HPC. Questa rete è solitamente costituita da connessioni 10/25/100/400/800 Gigabit Ethernet (GE).

Rete di Gestione

La rete di gestione distribuisce principalmente sistemi di gestione dei servizi e componenti di supporto operativo per allocare in modo efficiente i carichi di lavoro e distribuire le risorse, garantendo prestazioni e utilizzo ottimale delle risorse.

La rete di gestione nell'architettura di rete dei data center HPC può essere classificata in reti di gestione out-of-band e in-band. La rete di gestione out-of-band può ospitare l'accesso alla porta di gestione di più tipi di terminali nel data center e monitorare e gestire lo stato dei dispositivi fisici nel cluster, consentendo il funzionamento unificato e la manutenzione remota. La rete di gestione in-band fornisce l'interfaccia Internet alla rete aziendale/uffici, fornendo l'accesso a Internet al data center.

I data center destinati ai carichi di lavoro HPC sono in genere enormi, con migliaia di porte 100G-800G per cluster. Per migliorare l'interoperabilità della rete e consentire la gestione unificata di una così grande quantità di infrastrutture di rete, la rete di gestione utilizza in genere sistemi operativi di rete aperti per creare una rete altamente resiliente, flessibile e affidabile.

Rete di Stoccaggio

Nei data center HPC, la rete di archiviazione utilizza sistemi di archiviazione interconnessi ad alta velocità e a elevata larghezza di banda, progettati principalmente per archiviare vasti insiemi di dati generati dalle applicazioni HPC. Questa rete comprende componenti quali server di archiviazione, dispositivi di archiviazione e software di gestione dell'archiviazione. Il server di archiviazione collega i componenti della rete HPC, consentendo lo scambio di dati e l'accesso ai dati archiviati sui server. Nei data center HPC, i dispositivi di archiviazione sono in genere caratterizzati da caratteristiche di alta velocità e alta capacità, per soddisfare i requisiti di archiviazione di grandi insiemi di dati. Nel frattempo, per garantire una trasmissione dei dati rapida ed efficiente, è importante implementare un'infrastruttura di rete ad alta velocità, compresi gli switch e i moduli ottici. Il software di gestione dello storage svolge un ruolo fondamentale nella supervisione e nel controllo dei sistemi di storage, comprendendo funzioni come la gestione dei dati, la gestione delle risorse di storage, il backup e il ripristino dei dati e la sicurezza dei dati.

Nelle architetture di rete HPC ben progettate, la rete di archiviazione e la relativa infrastruttura sono ottimizzate per garantire un elevato throughput e una bassa latenza, assicurando un'archiviazione dei dati affidabile ed economica.

HPC Networking Architecture

Come si distingue il networking dei data center HPC?

I diversi fabric dell'architettura di rete dei data center HPC collaborano per costruire una rete senza perdite, ad alte prestazioni e scalabile. Questa rete distribuisce in modo efficiente i carichi di lavoro tra più risorse informatiche interconnesse, consentendo alle aziende di scalare rapidamente l'operatività dei carichi di lavoro di formazione multi-nodo su larga scala e di rimanere all'avanguardia nella competizione del settore. Le seguenti caratteristiche della rete di data center HPC consentono di soddisfare vari carichi di lavoro HPC e requisiti di scala.

  • Calcolo Parallelo – Le reti dei data center HPC utilizzano l'elaborazione parallela, consentendo l'esecuzione simultanea di più carichi di lavoro. Con migliaia di operazioni elaborate simultaneamente, le operazioni vengono completate in pochi millisecondi. Ciò consente alle industrie di addestrare modelli più grandi, migliori e accurati, accelerando i progressi del settore.

  • Dimensione – I data center HPC sono tipicamente di dimensioni enormi e comprendono potenzialmente migliaia di motori di calcolo (come GPU e CPU) e una vasta gamma di infrastrutture di connettività di rete che operano a velocità diverse.

  • Larghezza di Banda – Il traffico ad alta larghezza di banda deve fluire in entrata e in uscita dai server per consentire alle applicazioni di funzionare in modo efficace. Nelle moderne implementazioni di data center, le funzioni HPC raggiungono velocità di interfaccia fino a 400G per motore di calcolo.

  • Latenza – Il tempo di completamento dei carichi di lavoro HPC è un fattore critico che influenza l'esperienza dell'utente. Pertanto, le reti dei data center HPC adottano spesso tecnologie di rete a bassa latenza, come InfiniBand e RDMA.

  • Senza Perdite – Una rete lossless riduce al minimo la perdita di pacchetti, consentendo una trasmissione dei dati fluida ed efficiente, essenziale per i data center che gestiscono carichi di lavoro HPC per mantenere l'integrità dei dati e ottimizzare le prestazioni.

  • Gestione Unificata – Le reti HPC su larga scala sono costituite da numerose infrastrutture di rete. In genere, si utilizzano piattaforme di gestione unificate per configurare, monitorare e controllare questi componenti, semplificando così le operazioni e aumentando la sicurezza del sistema.

Per maggiori dettagli su RDMA, consultare Rete ad alta velocità potenziata RDMA per addestrare modelli di grandi dimensioni

Creare la Rete Efficace per i Carichi di Lavoro HPC con la Soluzione FS InfiniBand

Nel panorama globale della crescente adozione di applicazioni HPC e di calcolo HPC, FS presenta una soluzione HPC ad alte prestazioni. Sfruttando la tecnologia InfiniBand ad alta velocità e bassa latenza e una piattaforma operativa di rete elastica ed efficiente - PicOS® e AmpCon™, soluzione FS H100 InfiniBand aiuta le aziende a ottimizzare i carichi di lavoro HPC, a semplificare i processi aziendali HPC e a promuovere applicazioni intelligenti dell'HPC in vari settori.

Intera Gamma di Prodotti NVIDIA® InfiniBand per il Potenziamento delle Reti di Computing

NVIDIA® InfiniBand è riconosciuta a livello mondiale come una soluzione ad alta velocità, a bassa latenza e scalabile, adatta a supercomputer, HPC e data center cloud, che la rende la scelta principale per le reti di elaborazione HPC. In qualità di fidato Elite Partner della NVIDIA Partner Network, FS offre una gamma completa di prodotti NVIDIA® InfiniBand, proponendosi come fornitore di soluzioni affidabili nel campo dell'HPC.

Come illustrato nel diagramma sottostante, FS offre lo switch NVIDIA® Quantum-2 MQM9790 InfiniBand, l'adattatore NVIDIA® ConnectX®-7 InfiniBand e ricetrasmettitori e cavi InfiniBand con velocità fino a 800G, formando una rete InfiniBand specializzata per l'elaborazione HPC. Questa rete offre le prestazioni e le funzionalità di rete più veloci disponibili per affrontare i problemi più impegnativi del mondo.

Switch InfiniBand Quantum-2

Gli switch infiniBand FS NVIDIA® QM9700/9790 comprendono 64 porte da 400 Gb/s o 128 porte da 200 Gb/s su 32 connettori OSFP fisici. Sono in grado di fornire un throughput bidirezionale aggregato di 51,2 Tb/s con una capacità di oltre 66,5 miliardi di pacchetti al secondo (bpp), offrendo prestazioni di rete leader a livello mondiale.

Adattatori NVIDIA® ConnectX®-6/7 InfiniBand

Gli adattatori NVIDIA® InfiniBand di FS supportano PCIe 5.0 e offrono porte di rete singole a 400Gb/s. Gli adattatori NVIDIA® ConnectX-7 InfiniBand di FS includono funzionalità avanzate di In-Network Computing e motori programmabili aggiuntivi che consentono di preelaborare algoritmi di dati e di scaricare i percorsi di controllo delle applicazioni sulla rete.

Cavi e Transceiver InfiniBand

Vari transceiver FDR, EDR, HDR e NDR e cavi DAC/AOC/ACC con opzioni di splitter 1-2 e 1-4 offrono la massima flessibilità per creare una topologia a scelta. I moduli e i cavi FS NVIDIA® InfiniBand sono verificati al 100% dall'originale e garantiscono la perfetta compatibilità con gli switch NVIDIA® Quantum-2 e gli adattatori ConnectX-7.

InfiniBand Network

Piattaforma PicOS® e AmpCon™ per la Gestione Intelligente della Rete

Nella rete di gestione, gli switch FS PicOS® possono utilizzare le funzionalità avanzate del software PicOS® e della piattaforma di gestione AmpCon™ per consentire ai clienti di effettuare in modo efficiente il provisioning, il monitoraggio, la gestione, la risoluzione preventiva dei problemi e la manutenzione dell'infrastruttura HPC, ottenendo un maggiore utilizzo e riducendo l'OPEX complessivo. Il software FS PicOS® e la piattaforma di gestione AmpCon™ si combinano efficacemente per consentire la visualizzazione delle operazioni e la gestione dell'intera rete di data center HPC. I loro vantaggi specifici includono:

Software FS PicOS®

  • PicOS® è completamente standardizzato e retrocompatibile con le reti esistenti, rendendo facile l'integrazione con gli switch di Cisco, Juniper e altri. Ciò consente ai clienti di aggiornare gradualmente le proprie reti in base al proprio budget.

  • Abilitate la sicurezza zero-trust per i livelli di accesso con l'integrazione del principale NAC Policy Manager e il supporto completo dei meccanismi di sicurezza.

  • Lavorate con AmpCon™ per automatizzare il provisioning degli switch, l'implementazione e la configurazione senza errori su scala, con conseguente riduzione delle spese operative.

  • Utilizzate una soluzione aperta con array spine-leaf per supportare architetture di virtualizzazione flessibili e scalabili.

  • Ottenete una visibilità completa della rete con SNMP e sFlow, mentre gNMI offre una telemetria aperta efficiente ed efficace.

FS Piattaforma di Gestione AmpCon™

  • Il supporto per lo Zero-Touch Provisioning semplifica notevolmente il processo di installazione e implementazione, consentendo la distribuzione senza sforzo di centinaia o addirittura migliaia di switch PicOS®.

  • Robuste interfacce utente grafiche (GUI) consentono il monitoraggio in tempo reale delle prestazioni e delle condizioni della rete, con la possibilità di archiviare i dati di monitoraggio in un database on-premises o cloud-based per ulteriori analisi.

  • Gestione end-to-end del ciclo di vita della rete e provisioning, manutenzione, controllo della conformità e aggiornamenti automatizzati per evitare configurazioni errate e tempi di inattività.

  • As an open and extendable platform, AmpCon™ è pronto a sfruttare la telemetria e altre tecnologie emergenti, in continua evoluzione per portare nuovi livelli di analisi e automazione nell'era dell'HPC.

Management Network

FS Switch PicOS® per Migliorare l'Efficienza dell'Archiviazione dei Dati su Larga Scala

Collegati tramite moduli ottici 100G, switch PicOS® di FS reano una rete scalabile e ad alta larghezza di banda, facilitando una trasmissione efficiente dei dati per i sistemi di archiviazione dei centri dati HPC. Nel frattempo, gli switch FS PicOS® supportano il protocollo BGP con potenti funzionalità di controllo del routing, garantendo il percorso di inoltro ottimale e lo stato di inoltro a bassa latenza della rete di storage. Questi robusti switch aumentano in modo significativo le prestazioni delle reti di archiviazione, soddisfacendo così con facilità gli esigenti requisiti dei moderni carichi di lavoro HPC.

Storage Network

Il Pensiero Finale

Mentre la costruzione di reti di centri dati HPC continua ad espandersi, FS si distingue come fornitore globale di soluzioni di calcolo HPC. Oltre a offrire soluzioni e prodotti altamente affidabili, FS vanta sette magazzini locali globali che coprono oltre 200 Paesi, oltre a un sistema di supply chain robusto e agile. Ciò consente una rapida consegna dei prodotti, abbreviando i cicli di progetto dei clienti e permettendo loro di cogliere rapidamente le opportunità del mercato HPC. FS realizza oluzioni personalizzate per le diverse partizioni dell'architettura di rete dei data center HPC, facilitando la configurazione precisa in base ai requisiti di budget dei clienti e aiutandoli a gestire efficacemente i costi del progetto.

Con il progredire del campo dell'HPC, FS rimane impegnata nell'era dell'HPC, innovando continuamente soluzioni di calcolo HPC all'avanguardia per accelerare l'adozione della tecnologia HPC in diversi settori industriali.

 

Related Articles:

L'Ascesa dei Data Center HPC: FS che Potenzia i Data Center di Nuova Generazione

Comprendere meglio InfiniBand: Calcolo ad alte prestazioni nell'era digitale

Pica8 AmpCon™: Il Vostro Partner per l'Automazione di Rete Aperta

Potresti essere interessato a

Conoscenza
See profile for Sheldon.
Sheldon
Cosa è la porta SFP di uno switch Gigabit?
22 Mag 2023
89.0k
Conoscenza
Conoscenza
See profile for Migelle.
Migelle
Switch PoE, PoE+ e PoE++: Come scegliere?
16 Mar 2023
37.9k
Conoscenza
See profile for Sheldon.
Sheldon
LACP e PAGP: Qual è la differenza?
08 Mar 2023
25.9k
Conoscenza
Conoscenza
See profile for Moris.
Moris
DHCP o IP Statico: Qual è il migliore?
08 Mag 2023
59.2k
Conoscenza
See profile for Migelle.
Migelle
Switch Attivo vs Passivo: Quale Scegliere?
07 Dic 2020
21.4k
Conoscenza
See profile for Sheldon.
Sheldon
RIP vs OSPF: Qual è la differenza?
15 Nov 2022
29.5k
Conoscenza
See profile for Vincent.
Vincent
Capire il moduli BiDi
08 Mar 2021
20.3k
Conoscenza
Conoscenza
See profile for Vincent.
Vincent
XFP vs SFP+: Quali sono le differenze?
10 Gen 2023
15.2k