Italia

Tecnologia DDC: Una Soluzione Rivoluzionaria della Rete AIGC

Inviato il 18 Gen 2024 by
105

 

Entro il 2023, la tecnologia dei contenuti generati dall'intelligenza artificiale (AIGC), di cui ChatGPT è un ottimo esempio, fiorirà e cambierà il settore in diversi campi, tra cui la generazione di testi, lo sviluppo di codici e la produzione di poesie. In questo articolo esploreremo l'innovativa tecnologia DDC per il networking, una soluzione rivoluzionaria introdotta dalla nuova generazione di AIGC Network. Questa tecnologia innovativa promette di rivoluzionare il panorama del networking, migliorando l'efficienza e la connettività in modi mai visti prima.

Tre Metodi di Condivisione del Carico della GPU

La straordinaria potenza dei modelli di grandi dimensioni dell'AIGC sopra menzionati deriva non solo dalla vasta quantità di dati, ma anche dalla continua evoluzione e dal progresso degli algoritmi. Quando si addestrano questi modelli di grandi dimensioni, spesso sono necessarie più GPU per distribuire il carico di lavoro. Per ottenere una condivisione efficiente del carico, vengono impiegati tre metodi: il parallelismo dei dati, il parallelismo dei tensori e il parallelismo delle pipeline.

Parallelismo dei Dati

Il parallelismo dei dati prevede la suddivisione dei dati di ingresso del modello in più mini-batch e l'elaborazione in parallelo di questi mini-batch su diverse GPU. Ogni GPU possiede una copia completa del modello e gestisce in modo indipendente i propri mini-batch. Attraverso la comunicazione e la sincronizzazione tra le GPU, i parametri del modello vengono aggiornati e integrati. Il parallelismo dei dati è adatto a modelli con set di dati di formazione su larga scala, accelerando il processo di formazione e migliorando la velocità di convergenza del modello.

Parallelismo Tensoriale

Il parallelismo tensoriale è tipicamente impiegato quando il modello è troppo grande per essere inserito nella memoria di un singolo processore. In questo metodo, parti diverse del modello sono assegnate a GPU diverse, con ciascuna GPU responsabile dell'elaborazione di una parte dei dati di ingresso e dell'esecuzione dei calcoli corrispondenti. Attraverso frequenti comunicazioni e sincronizzazioni tra le GPU, i risultati vengono raccolti e integrati, il che può comportare un elevato overhead di comunicazione. Le connessioni ad alta velocità tra i processori sono necessarie per il parallelismo tensoriale per ridurre al minimo i ritardi di scambio.

Parallelismo della Pipeline

Il parallelismo di pipeline suddivide il flusso di calcolo del modello in più fasi, parallelizzando l'esecuzione di queste fasi su diverse GPU in modo pipeline. Ogni GPU gestisce una porzione specifica del calcolo complessivo del modello, passando i risultati elaborati alla GPU successiva per ulteriori calcoli. Questo approccio riduce il tempo complessivo di addestramento ed è particolarmente vantaggioso per i modelli con flussi di calcolo complessi e più fasi consecutive, ma richiede un'attenta gestione della pipeline per evitare di creare stalli troppo ampi, in cui alcuni processori possono mettere in pausa il loro lavoro in attesa dei risultati di calcolo dipendenti. A volte, queste tre tattiche parallele vengono accoppiate per migliorare il processo di addestramento.

Tre Soluzioni Tradizionali per Supportare il Funzionamento dell'AIGC

Nelle soluzioni tradizionali, esistono tre soluzioni comuni per supportare il funzionamento di AIGC: InfiniBand, RDMA e frame switch.

Rete InfiniBand

La rete InfiniBand è una tecnologia di interconnessione ad alta velocità utilizzata nei centri di calcolo e di dati ad alte prestazioni. I suoi vantaggi sono l'elevata larghezza di banda, la bassa latenza e l'assenza di congestione. Tuttavia, può essere costosa e costa diverse volte di più della rete Ethernet tradizionale.

InfiniBand Networking

Rete RDMA

RDMA (Remote Direct Memory Access) è un nuovo meccanismo di comunicazione. Nello schema RDMA, i dati possono comunicare direttamente con la scheda di rete, bypassando la CPU e il complesso sistema operativo, il che aumenta significativamente il throughput dei dati e riduce la latenza. In precedenza, RDMA veniva utilizzato principalmente sulla rete InfiniBand. Ora viene progressivamente portato su Ethernet. L'attuale schema di rete mainstream si basa sul protocollo RoCE v2 per costruire una rete che supporti RDMA.

Controlla anche-RDMA over Converged Ethernet Guida.

RDMA Networking

Switch di Telaio

Per switch di telaio si intende uno switch di rete progettato specificamente per gestire protocolli basati su frame, come Ethernet. Tuttavia, a causa di problemi quali la limitata scalabilità, l'elevato consumo energetico dei dispositivi e gli ampi domini di guasto, questa tecnica è appropriata solo per l'implementazione di cluster di computer AI su piccola scala.

Nuova Generazione di Rete AIGC: Tecnologia DDC

A causa del collo di bottiglia delle prestazioni dell'Ethernet tradizionale, gli approcci convenzionali soffrono ancora di perdite di prestazioni come congestione e perdita di pacchetti e hanno una scalabilità insufficiente. In risposta a queste limitazioni, è emersa una soluzione innovativa nota come DDC (Distributed Disaggregated Chassis). Il DDC decostruisce il frame switch convenzionale, migliorandone la scalabilità e consentendo di adattare la scala della rete alle dimensioni del cluster di intelligenza artificiale.

Il DDC non solo soddisfa i requisiti di rete per l'addestramento di modelli di intelligenza artificiale su larga scala in termini di scala e throughput di banda, ma affronta anche altri aspetti cruciali del funzionamento della rete. Tuttavia, il funzionamento della rete non riguarda solo questi due aspetti, ma deve essere ottimizzato anche in termini di latenza, bilanciamento del carico, efficienza di gestione e così via. Per affrontare queste sfide, il DDC incorpora le seguenti strategie tecniche:

La tecnologia di Inoltro basata su VOQ+Celle Combatte la Perdita di Pacchetti

Negli scenari in cui la rete subisce raffiche di traffico, l'elaborazione può risultare lenta al ricevitore, con conseguente congestione e perdita di pacchetti. Il sistema DDC impiega il meccanismo di inoltro basato su VOQ+Celle, che offre una soluzione robusta. Approfondiamo il processo specifico:

Il mittente classifica e memorizza i pacchetti nelle Virtual Output Queues (VOQ) dopo averli ricevuti. Il NCP (Network Connection Point) controlla la capacità del buffer prima di segmentare e bilanciare dinamicamente il carico. In caso di limitazioni temporanee dell'elaborazione, i pacchetti vengono memorizzati all'interno delle VOQ, migliorando la stabilità della comunicazione e l'utilizzo della larghezza di banda.

VOQ+Cell

 

Distribuzione PFC Single-Hop che Evita Completamente il Deadlock

Le reti RDMA lossless utilizzano la tecnologia PFC (Priority Flow Control) per il controllo del traffico, consentendo la creazione di più canali virtuali per i collegamenti Ethernet con priorità assegnate. Tuttavia, l'implementazione del PFC non è priva di problemi, in particolare per quanto riguarda i problemi di deadlock.

PFC Single-Hop Deployment

Nel contesto della rete DDC, un vantaggio distintivo deriva dal fatto di considerare tutti i punti di connessione di rete (NCP) e le funzioni di comunicazione di rete (NCF) come entità coese, eliminando la necessità di switch a più livelli. Di conseguenza, l'architettura DDC aggira efficacemente il problema del deadlock associato al PFC, garantendo operazioni di rete continue e ininterrotte.

NCFs

 

Il SO Distribuito Migliora l'Affidabilità

Nell'architettura DDC, la funzione di gestione è centralizzata sotto il controllo della scheda di controllo della rete (NCC). Tuttavia, questo controllo centralizzato presenta il rischio potenziale di un singolo punto di guasto. Per attenuare questo problema, il DDC incorpora un sistema operativo distribuito, che consente funzionalità di gestione individuali per ciascun punto di connessione di rete (NCP) e funzione di comunicazione di rete (NCF). Questo approccio distribuito include piani di controllo e gestione indipendenti per una maggiore affidabilità del sistema e processi di implementazione semplificati.

Conclusione

DDC affronta efficacemente le esigenze di rete associate all'addestramento di modelli di intelligenza artificiale su larga scala grazie alle sue strategie tecniche distintive. Inoltre, ottimizza meticolosamente numerosi aspetti per garantire la stabilità e l'efficienza della rete in scenari diversi e complessi.

Potresti essere interessato a

Conoscenza
See profile for Sheldon.
Sheldon
Cosa è la porta SFP di uno switch Gigabit?
22 Mag 2023
83.6k
Conoscenza
Conoscenza
See profile for Migelle.
Migelle
Switch PoE, PoE+ e PoE++: Come scegliere?
16 Mar 2023
36.8k
Conoscenza
See profile for Sheldon.
Sheldon
LACP e PAGP: Qual è la differenza?
08 Mar 2023
25.1k
Conoscenza
Conoscenza
See profile for Moris.
Moris
DHCP o IP Statico: Qual è il migliore?
08 Mag 2023
55.6k
Conoscenza
See profile for Migelle.
Migelle
Switch Attivo vs Passivo: Quale Scegliere?
07 Dic 2020
20.3k
Conoscenza
See profile for Sheldon.
Sheldon
RIP vs OSPF: Qual è la differenza?
15 Nov 2022
28.6k
Conoscenza
See profile for Vincent.
Vincent
Capire il moduli BiDi
08 Mar 2021
19.9k
Conoscenza
See profile for Vincent.
Vincent
XFP vs SFP+: Quali sono le differenze?
10 Gen 2023
14.9k
Conoscenza