Switch InfiniBand Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 in Produzione
April 15, 2026
Un importante istituto di ricerca sull'IA dell'Asia orientale ha affrontato un collo di bottiglia comune ma critico.La Commissione europea ha presentato una proposta di regolamento (CE) del Consiglio che modifica il regolamento (CE) n.La causa principale era la struttura Ethernet 100Gb/s, in cui TCP/IP overhead e perdita di pacchetti durante eventi incast causavano tempi di inattività della GPU fino al 35%.tessuto a latenza ultra bassa che potrebbe supportare RDMA e scalare a migliaia di nodi senza compromettere le prestazioni deterministicheDopo aver valutato diverse soluzioni, sono state selezionate leMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0Lo switch InfiniBand come nucleo della loro nuova architettura spine-leaf.
La distribuzione si è concentrata sulla920-9B210-00FN-0D0come strato spinale, con 32 switch a foglia che collegano 512 GPU NVIDIA A100 tramite adattatori ConnectX-7.920-9B210-00FN-0D0 MQM9790-NS2F 400 Gb/s NDRL'interfaccia offre 400Gb/s per porta, raddoppiando la larghezza di banda delle precedenti soluzioni HDR mantenendo una latenza di commutazione inferiore al microsecondo.920-9B210-00FN-0D0 InfiniBand switch OPNGli ingegneri di rete hanno utilizzato le informazioni dettagliate e le informazioni disponibili per fornire un'analisi dettagliata dei processi di approvvigionamento.920-9B210-00FN-0D0 scheda dati- e920-9B210-00FN-0D0 specificheL'interruttore è stato progettato per essere utilizzato per la convalida dei requisiti di potenza e di calore, consentendo un'integrazione senza soluzione di continuità nei rack esistenti da 19 pollici.920-9B210-00FN-0D0 compatibilesia con l'infrastruttura HDR esistente che con i nuovi endpoint NDR, consentendo una migrazione graduale.
- Aumenti dell'efficienza della RDMA:Con ilNVIDIA Mellanox 920-9B210-00FN-0D0consentendo il controllo della congestione basato su hardware, la latenza di scrittura RDMA è scesa da 12 μs a 1,2 μs. La RDMA diretta GPU (GDR) è diventata pienamente efficace, eliminando i colli di bottiglia della memoria CPU.
- Accelerazione delle applicazioni HPC:Un codice chiave di modellazione del tempo (basato su MPI) ha visto un miglioramento delle prestazioni di 2,7 volte a causa del routing adattivo dello switch e degli scarichi collettivi SHARP v2.
- Attuazione della formazione dell'IA:Per un lavoro di formazione LLM di 175 miliardi di parametri, il nuovo tessuto ha ridotto il tempo di riduzione totale del 68%, migliorando l'utilizzo complessivo della GPU dal 62% al 91%.
- Semplicità operativa:Il920-9B210-00FN-0D0 InfiniBand switch OPN soluzioneI responsabili IT hanno riferito di una riduzione del 50% del tempo di risoluzione dei problemi relativi alla rete.
Nel corso della valutazione del progetto, l'Istituto di ricerca ha valutato i risultati920-9B210-00FN-0D0 prezzoNonostante un costo iniziale più elevato, il costo totale di proprietà (TCO) ha favorito InfiniBand a causa dell'utilizzo più elevato della GPU e della minore potenza per Gb / s.Le unità sono prontamente disponibili come920-9B210-00FN-0D0 in venditaL'interfaccia NDR è stata creata per la distribuzione di NVIDIA, con tempi di consegna significativamente più brevi rispetto ad altri switch NDR.920-9B210-00FN-0D0 specificheha inoltre confermato il supporto per le sorgenti di alimentazione ridondanti e i ventilatori scambiabili a caldo, soddisfacendo i requisiti di affidabilità dell'istituto per le operazioni di ricerca sull'IA 24/7.
| Parametro | Dettaglio |
|---|---|
| Modello | NVIDIA Mellanox 920-9B210-00FN-0D0 |
| Velocità della porta | 400Gb/s NDR (per porta) |
| OPN di base | 920-9B210-00FN-0D0 InfiniBand switch OPN |
| Configurazione completa | 920-9B210-00FN-0D0 MQM9790-NS2F 400 Gb/s NDR |
L'Istituto di ricerca sull'IA ha ora standardizzato la920-9B210-00FN-0D0Questo caso reale dimostra che il sistema di distribuzione dei dati è in grado di fornire un'ottima base di dati per tutte le future espansioni dei cluster, inclusa una struttura NDR200 di 2.048 GPU.NVIDIA Mellanox 920-9B210-00FN-0D0Per gli architetti e i manager IT che cercano di eliminare i colli di bottiglia della rete,Il920-9B210-00FN-0D0 InfiniBand switch OPN soluzioneoffre un percorso comprovato e pronto per la produzione.

