NVIDIA Mellanox MQM9790-NS2F 인피니밴드 스위치 작동: 저연속 인터커넥트 최적화
April 13, 2026
NVIDIA Mellanox MQM9790-NS2F 인피니밴드 스위치 작동: RDMA/HPC/AI 클러스터를 위한 저연속 인터커넥트 최적화
인공지능 훈련, 고성능 컴퓨팅 (HPC) 시뮬레이션 및 대규모 분산 스토리지에서 네트워크 지연과 대역폭은 종종 클러스터 효율의 상한을 결정합니다.조직이 이 병목을 극복할 수 있도록,MQM9790-NS2FNVIDIA Mellanox의 InfiniBand 스위치는 많은 AI 및 HPC 배포에서 핵심 인터 커넥트 구성 요소가되고 있습니다. 이 기사는 대규모 AI 교육 클러스터의 실제 세계 업그레이드를 진행합니다.이 스위치가 낮은 지연 RDMA 네트워크와 측정 가능한 성능 향상을 어떻게 제공하는지를 보여줍니다..
배경 및 도전: 천-GPU에서 열-천-GPU 네트워크 압력
한 선도적인 연구 기관은 이전에는 대규모 언어 모델 훈련과 기상 시뮬레이션을 위해 1000GPU 클러스터를 운영했습니다.모델의 매개 변수가 수십억에서 수십억으로 증가하면서, 기존의 200Gb/s HDR InfiniBand 네트워크는 혼잡과 통신 오버헤드가 증가하기 시작했습니다. 크로스 노드 All-Reduce 작업은 훨씬 오래 걸렸습니다.그리고 GPU는 네트워크 전송을 기다리는 동안 빈번하게 무동으로 작동합니다.건축가들은 긴급히 더 높은 항구 밀도, 더 세밀한 부하 균형 및 기존 RDMA 인프라와 완전한 호환성을 제공하는 솔루션이 필요했습니다.
철저한 평가를 거쳐 연구팀은 NDR 등급 인피니밴드 직물을NVIDIA 멜라노크스 MQM9790-NS2F. 64 OSFP 포트, 각각의 400Gb / s 라인 속도에서 작동, 스위치는 완벽하게 다음 세대의 GPU 서버의 처리량 요구에 부합합니다.
솔루션 및 배포: NDR 패브릭 + 손실 없는 RDMA 네트워크
새로운 디자인에서 각 GPU 서버는 두 개의 리프 스위치로 연결된 듀얼 포트 ConnectX‐7 어댑터로 장착됩니다.MQM9790-NS2F 400Gb/s NDR 64-포트 OSFP스위치는 차단되지 않는 클로스 아키텍처를 사용하여 두 계층의 FAT-Tree 토폴로지를 형성합니다. 적응적 라우팅 및 혼잡 제어가 활성화됩니다.원본 InfiniBand RDMA를 활용하여 GPU 메모리에서 원격 GPU 메모리로 데이터를 직접 전송합니다., CPU와 소프트웨어 스택을 우회합니다.
- 포트 사용 및 호환성:기존의 HDR 어댑터는 이전 투자를 보호하여 낮은 속도로 작동 할 수 있습니다.MQM9790-NS2F 호환이 목록은 일반 GPU 서버와 저장 시스템을 포함하며, 배포 중에 드라이버 변경이 필요하지 않습니다.
- 지능형 운영:내장된 텔레메트리 모니터는 오류와 혼잡을 실시간으로 연결하여 팀들이 광 모듈 또는 케이블 문제를 신속하게 고립하고 평균 수리 시간을 크게 줄이는 데 도움이됩니다.
결과와 혜택: 교육 반복 시간이 38% 감소, 네트워크 오버헤드 8%로 떨어집니다.
업그레이드 후 기관은 생산 작업량에 대한 비교 테스트를 수행했습니다.MQM9790-NS2F 인피니밴드 스위치반복 시간이 2.8초에서 1.73초로 줄었습니다. 38%의 향상입니다. 네트워크 통신의 전체 지연시간의 비중은 22%에서 8%로 줄었습니다.GPU가 유용한 계산에 훨씬 더 많은 시간을 보냈다는 것을 의미합니다.NDR 스위치 내부의 SHARPv3 네트워크 컴퓨팅 덕분에 All-Reduce 대역폭 사용량은 거의 두 배로 증가했습니다.
스토리지 측면에서는 InfiniBand를 통해 낮은 지연 NVMe가 병렬 파일 시스템의 전체 읽기 / 쓰기 대역폭을 2.3 × 증가시켰다.체크포인트 저장 및 복원 시간은 12분에서 5분 이하로 줄어들었습니다.이 수치는 내부 시험 보고서에 기록되어 있으며MQM9790-NS2F 사양시작점
요약 및 전망: 차세대 인공지능 인프라의 기본 선택으로 NDR 인터 커넥트
이 사례는 대규모 RDMA/HPC/AI 클러스터의 경우MQM9790-NS2F 인피니밴드 스위치 솔루션효율적으로 네트워크 혼잡을 제거하고 GPU 활용도를 높이고 작업을 단순화합니다.MQM9790-NS2F 데이터 시트전력, 포트 밀도 및 특징 세트를 평가하는 데 필수적인 참조입니다. 모델은 이제 대량 생산 중입니다.MQM9790-NS2F 가격또는MQM9790-NS2F 판매궁금한 사항은 NVIDIA의 승인된 파트너와 연락하세요.NDR 스위칭 플랫폼은 컴퓨팅 잠재력을 풀기 위해 중추적인 역할을 계속할 것입니다..

