멜라녹스 (NVIDIA 멜라녹스) 920-9B110-00FH-0D0 액션: RDMA/HPC/AI 클러스터를 위한 저연속 인터커넥트를 최적화
April 14, 2026
대규모 인공지능 모델 훈련과 초대형 HPC 시대에서 네트워크 지연은 선형 클러스터 확장성을 제한하는 가장 중요한 단 하나의 병목으로 나타났습니다.,의멜라녹스 (NVIDIA 멜라녹스) 920-9B110-00FH-0D0인피니밴드 스위치는 연구 기관과 기업 인공지능 연구소가 고성능 직물을 설계하는 방식을 변화시키고 있습니다. 이 기사는920-9B110-00FH-0D0RDMA를 많이 사용하는 작업에 있어서 결정적이고 낮은 지연 시간을 제공합니다.
배경과 도전: 인공지능 클러스터 커뮤니케이션 벽
중견 규모의 인공지능 연구 시설은 64개의 노드에서 분산된 훈련 중에 GPU 무동시간에 어려움을 겪고 있었습니다.집단 커뮤니케이션 작업 (all-reduce네트워크 아키텍트들은 초소초 이하의 지연을 유지하면서 포트당 200Gb/s까지 확장할 수 있는 손실 없는 고 처리량 솔루션이 필요했습니다..사용 가능한 옵션을 평가 한 후 팀은920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR그들의 새로운 척추 잎 토폴로지의 핵심 빌딩 블록입니다.
솔루션 및 배포: 인피니밴드 패브릭을 구현
이 배포는NVIDIA 멜라녹스 920-9B110-00FH-0D0두 계층의 지방 나무 구조로 구성된 스위치. 각 컴퓨팅 노드에는 HDR ConnectX-6 어댑터가 장착되어 있으며, 수동 구리 케이블을 통해 잎 스위치에 연결됩니다.주요 실행 단계 포함:
- 컨버지드 이더넷 (RoCE) 이상 RDMA 옵션:하드웨어 기반의 혼잡 제어와 함께 네이티브 인피니밴드는 패킷 드롭을 완전히 제거했습니다.
- 어댑티브 라우팅:의920-9B110-00FH-0D0 InfiniBand 스위치 OPN 솔루션다중 경로를 통해 동적 로드 밸런싱을 가능하게 하고, 핫스팟 형성을 방지합니다.
- 직물 관리:하위 네트워크 관리자 (OpenSM) 를 사용하여920-9B110-00FH-0D0 사양하나의 조직에서 최대 2,000개의 노드를 지원하는 것을 확인합니다.
조달 전에 엔지니어들은920-9B110-00FH-0D0 데이터 시트기존 광학과 호환성을 검증하기 위해920-9B110-00FH-0D0 호환에코시스템은 모든 주요 HDR 케이블 어셈블리를 포함하여 재료의 청구서를 단순화했습니다.920-9B110-00FH-0D0 가격대안 HDR 스위치에 비해 경쟁력을 입증했으며 단위는 쉽게 사용할 수있었습니다 (920-9B110-00FH-0D0 판매NVIDIA 채널 파트너를 통해.
결과와 이점: 측정 가능한 성능 향상
배포 후 텔레메트리는 세 가지 주요 메트릭에서 극적인 개선이 나타났습니다.
| 메트릭 | 이전 (100GbE) | 후 (920-9B110-00FH-0D0 HDR) | 개선 |
|---|---|---|---|
| 평균 모든 감소 지연 (64 노드) | 340μs | 78μs | 77% 감소 |
| GPU 비동기 시간 (통신 오버헤드) | 38% | 11% | 27%의 절대 이득 |
| 효율적인 직물 대역폭 이용 | 62% | 94% | +32% |
순수 숫자를 넘어서920-9B110-00FH-0D0 InfiniBand 스위치 OPN조직을 재설계하지 않고도 64개의 노드에서 256개의 노드까지 확장할 수 있게 했습니다.InfiniBand의 신용 기반 흐름 제어로 제공되는 결정적 지연은 수백 개의 GPU에서 훈련 일관성을 유지하는 데 필수적 인 것으로 나타났습니다.공학자들은 또한920-9B110-00FH-0D0'의 하드웨어 기반 혼잡 알림 실시간으로 미시 폭발을 식별하고 해결하기 위해.
요약 & 전망: 인공지능 상호 연결의 미래
배포는NVIDIA 멜라녹스 920-9B110-00FH-0D0AI 및 HPC 클러스터의 다음 세대의 기본 요소로 작용합니다. 손실이 없는 InfiniBand로 손실이 없는 이더넷 패브릭을 대체함으로써,조직은 통신 스탠드에서 이전에 낭비 된 GPU 컴퓨팅의 최대 30%를 복구 할 수 있습니다.새로운 인공지능 인프라를 계획하는 건축가들에게는920-9B110-00FH-0D0 데이터 시트작은 DGX 클러스터에서 슈퍼 컴퓨팅 규모의 배포에 이르기까지 토폴로지에 대한 자세한 지침을 제공합니다.
작업 부하가 더 큰 모델 병렬화와 더 높은 GPU 밀도로 발전함에 따라920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR후향 호환성 디자인을 통해 미래의 400Gb / s 섬유에 대한 명확한 업그레이드 경로를 제공합니다.920-9B110-00FH-0D0 가격운영 효율성 증대 또는 확인920-9B110-00FH-0D0 호환이 InfiniBand 스위치는 데이터 기반 조직에 측정 가능한 ROI를 제공합니다.

