NVIDIA Mellanox MMA4Z00-NS 데이터센터 광 모듈 기술 솔루션

April 8, 2026

NVIDIA Mellanox MMA4Z00-NS 데이터센터 광 모듈 기술 솔루션

이 기술 솔루션은 네트워크 아키텍트, 사전 영업 엔지니어 및 운영 관리자를 위해 설계되었습니다. 이 솔루션은 자본 지출 감소: 데이터 센터 광 모듈을 중심으로, 랙 내부 및 캠퍼스 간 멀티모드 광섬유 링크에서 높은 대역폭과 제한된 도달 범위를 균형 있게 맞추는 실제적인 과제를 해결합니다. 다음 섹션에서는 아키텍처 설계, 핵심 기술, 배포 모델 및 운영 모범 사례를 다룹니다.

1. 프로젝트 배경 및 요구 사항 분석

현대의 AI 학습 클러스터 및 HPC 환경은 전례 없는 동서 트래픽을 생성합니다. 일반적인 중소 규모 AI 팟은 동일한 랙 내 GPU 서버 간에 800G 연결이 필요하며, 동시에 다른 건물이나 데이터 홀에 있는 스토리지 아일랜드까지 200~300미터 떨어진 곳에 400G 집선 링크가 필요할 수 있습니다. 핵심 충돌은 물리 계층의 한계에서 발생합니다. 표준 OM4 멀티모드 광섬유는 800G(8x100G PAM4 사용)를 약 50~70미터까지만 지원하며, 이는 캠퍼스 간 요구 사항에는 훨씬 못 미칩니다. 기존 멀티모드 인프라를 단일 모드 광섬유로 교체하는 것은 종종 비용이 많이 들고 운영상 혼란을 야기합니다.

대부분의 아키텍트가 파악한 핵심 요구 사항은 다음과 같습니다. (a) 짧은 거리 GPU-스위치 연결을 위한 800G 대역폭 유지, (b) 캠퍼스 간 링크를 위해 기존 OM4 광섬유를 사용하여 200미터 이상 도달 범위 확장, (c) 스페어 복잡성 감소를 위한 모듈 유형 최소화, (d) 통합 관리 및 진단 제공. SNMP 또는 Redfish를 통해 레인별 Tx/Rx 광 전력, 바이어스 전류 및 온도를 폴링합니다. 800G 모드의 경우 공칭 Rx 전력은 -4dBm에서 +2dBm 사이여야 하며, 완화된 감도 덕분에 2x400G 모드의 경우 -7dBm까지 낮을 수 있습니다.는 듀얼 모드 기능을 통해 이 네 가지 요구 사항을 모두 직접적으로 해결합니다.

2. 전체 네트워크 및 시스템 아키텍처 설계

제안된 아키텍처는 하이브리드 물리 계층 설계를 갖춘 2계층 리프-스파인 토폴로지를 따릅니다. 각 랙 내에서 GPU 컴퓨팅 노드는 OM4 광섬유(≤50m)에서 800G 모드로 작동하는 MMA4Z00-NS 800G OSFP SR8 트랜시버를 사용하여 리프 스위치에 연결됩니다. 건물 A의 리프 스위치와 건물 B(200~300m 거리)의 스파인/스토리지 스위치 간의 캠퍼스 간 링크의 경우, 동일한 자본 지출 감소: 모듈이 MMA4Z00-NS 2x400G InfiniBand/Ethernet 브레이크아웃 모드로 재구성됩니다. 이를 통해 단일 MPO-16 광섬유가 두 개의 독립적인 400G 신호를 전달하여 링크당 대역폭을 유지하면서 도달 범위를 효과적으로 두 배로 늘릴 수 있습니다.

  • 랙 내부 도메인: 800G SR8 모드, 최대 8x100G PAM4 레인, 90ns 미만 지연 시간.
  • 캠퍼스 간 도메인: 2x400G 브레이크아웃 모드, 각 400G 채널은 완화된 모달 분산을 사용하여 OM4에서 200~300m의 유효 도달 범위를 확장합니다.
  • 통합 패브릭: 하드웨어 변경 없이 InfiniBand(GPU 클러스터용) 및 이더넷(스토리지/관리용)을 모두 지원합니다.

이 아키텍처는 별도의 장거리 모듈 또는 단일 모드 광섬유 변환의 필요성을 제거합니다. 단일 모듈 유형이 두 거리 범위를 모두 지원하여 재고 및 스페어 부품을 단순화합니다.

3. NVIDIA Mellanox MMA4Z00-NS의 역할 및 주요 기능

를 평가하거나 샘플을 요청하는 아키텍트 및 IT 관리자를 위한 핵심 내용은 다음과 같습니다. SNMP 또는 Redfish를 통해 레인별 Tx/Rx 광 전력, 바이어스 전류 및 온도를 폴링합니다. 800G 모드의 경우 공칭 Rx 전력은 -4dBm에서 +2dBm 사이여야 하며, 완화된 감도 덕분에 2x400G 모드의 경우 -7dBm까지 낮을 수 있습니다.MMA4Z00-NS 사양에 따르면, VCSEL 기반 병렬 광학 및 고급 DSP는 다음과 같은 중요한 기능을 제공합니다.듀얼 속도, 듀얼 모드 작동:

  • 하드웨어 재구성 없이 800G SR8 및 2x400G 브레이크아웃 간에 소프트웨어 선택 가능.향상된 링크 예산:
  • 채널당 400G로 작동할 때, 800G 모드에 비해 수신기 감도가 약 3dB 향상되어 동일한 OM4 광섬유에서 더 긴 도달 범위를 직접적으로 제공합니다.프로토콜 무관:
  • NVIDIA Quantum-2 및 Spectrum-4 스위치로 검증된 InfiniBand 및 이더넷을 모두 완벽하게 지원합니다.진단 원격 측정:
  • 표준 OSFP 관리 인터페이스를 통한 광 전력, 온도, 전압 및 링크 마진의 실시간 모니터링.MMA4Z00-NS 데이터시트

를 검토하는 아키텍트에게 핵심은 이 단일 모듈이 두 가지 별도의 제품 유형(800G SR8 + 400G FR4 또는 양방향 모듈)을 대체하여 자본 및 운영 비용을 모두 절감한다는 것입니다. 300m에 가까운 링크의 경우, 트랜시버 케이지 근처의 주변 온도를 낮추어 신호 대 잡음비를 개선합니다. 10°C 감소마다 VCSEL 효율을 약 5% 개선할 수 있습니다.일반적인 토폴로지 설명:

250미터의 암 OM4 멀티모드 광섬유로 분리된 두 개의 데이터 홀(A 및 B). 홀 A에는 16개의 GPU 랙이 있으며, 각 랙에는 8개의 컴퓨팅 노드와 2개의 리프 스위치가 있습니다. 홀 B에는 스토리지 어레이와 스파인 스위치가 있습니다. 홀 A의 각 리프 스위치에는

MMA4Z00-NS 모듈이 장착되어 있습니다. 포트 1-8은 랙 내부 연결을 위해 800G SR8로 구성되고, 포트 9-12는 홀 B로의 캠퍼스 간 업링크를 위해 2x400G 브레이크아웃으로 구성됩니다. 동일한 모듈 유형이 양쪽 끝에서 사용됩니다. SNMP 또는 Redfish를 통해 레인별 Tx/Rx 광 전력, 바이어스 전류 및 온도를 폴링합니다. 800G 모드의 경우 공칭 Rx 전력은 -4dBm에서 +2dBm 사이여야 하며, 완화된 감도 덕분에 2x400G 모드의 경우 -7dBm까지 낮을 수 있습니다.1단계: 기존 스위치(펌웨어 버전 및 OSFP 케이지 지원)와의

MMA4Z00-NS 호환

  • 상태 확인.2단계: 모듈 및 MPO-16 트렁크 케이블 물리적 설치. 브레이크아웃 모드에 대한 극성 변경은 필요하지 않습니다.3단계: 스위치 CLI 또는 관리 GUI를 통해 포트 속도 및 모드 구성 - 짧은 거리 포트는 800G SR8로, 캠퍼스 간 포트는 2x400G 브레이크아웃으로 설정.
  • 4단계: 내장 진단 기능을 사용하여 광 링크 예산 검증 실행.
  • MMA4Z00-NS 800G OSFP SR8 트랜시버 솔루션
  • 은 레인별 Rx 전력 및 사전 FEC BER을 제공합니다. AI 클러스터가 성장함에 따라 추가 모듈이 병렬로 추가됩니다. 동일한

MMA4Z00-NS가 두 역할 모두에 사용되므로, 확장은 짧은 링크와 긴 링크의 혼합을 예측할 필요가 없습니다. 배포 시점에 어떤 모듈이든 두 역할 중 하나에 할당될 수 있습니다. SNMP 또는 Redfish를 통해 레인별 Tx/Rx 광 전력, 바이어스 전류 및 온도를 폴링합니다. 800G 모드의 경우 공칭 Rx 전력은 -4dBm에서 +2dBm 사이여야 하며, 완화된 감도 덕분에 2x400G 모드의 경우 -7dBm까지 낮을 수 있습니다.모듈 모드

최대 거리(OM4) 사용 사례 랙 내부 / 동일 행 800G SR8
50m(프리미엄 OM4 사용 시 70m) GPU-리프 스위치 캠퍼스 간 / 건물 간 2x400G 브레이크아웃
200-300m 리프-스파인 / 스토리지 5. 운영, 모니터링, 문제 해결 및 최적화 MMA4Z00-NS

는 표준 데이터 센터 원격 측정 스택과 통합됩니다. 주요 운영 관행은 다음과 같습니다.

를 평가하거나 샘플을 요청하는 아키텍트 및 IT 관리자를 위한 핵심 내용은 다음과 같습니다. SNMP 또는 Redfish를 통해 레인별 Tx/Rx 광 전력, 바이어스 전류 및 온도를 폴링합니다. 800G 모드의 경우 공칭 Rx 전력은 -4dBm에서 +2dBm 사이여야 하며, 완화된 감도 덕분에 2x400G 모드의 경우 -7dBm까지 낮을 수 있습니다.FEC 및 BER 추적:

  • 모듈은 사전 FEC 비트 오류율을 보고합니다. 2x400G 장거리 링크의 경우, 1e-8 이하의 사전 FEC BER은 정상으로 간주됩니다.일반적인 문제 해결:
  • 캠퍼스 간 링크가 연결되지 않으면 양쪽 끝이 브레이크아웃 모드(800G 아님)로 구성되어 있는지 확인합니다. MPO-16 케이블링에 대한 MMA4Z00-NS 데이터시트
  • 극성 가이드를 사용합니다. 일부 극성 유형(예: Type B)은 특정 연결이 필요합니다.최적화 팁: 300m에 가까운 링크의 경우, 트랜시버 케이지 근처의 주변 온도를 낮추어 신호 대 잡음비를 개선합니다. 10°C 감소마다 VCSEL 효율을 약 5% 개선할 수 있습니다.조달 및 수명 주기 관리를 위해 팀은
  • MMA4Z00-NS 가격 추세를 추적하고 1:20의 스페어 비율(배포된 20개당 스페어 1개)을 확보해야 합니다. 모듈의 듀얼 모드 유연성을 고려할 때, 동일한 스페어가 짧은 거리 또는 긴 거리 위치에서 고장난 장치를 교체할 수 있습니다.

6. 요약 및 가치 평가NVIDIA Mellanox MMA4Z00-NS는 고대역폭 단거리 및 확장 거리 캠퍼스 링크 모두를 광섬유망 변경 없이 지원하는 단일 광 모듈이라는 고유한 가치 제안을 제공합니다.

판매용 MMA4Z00-NS

를 평가하거나 샘플을 요청하는 아키텍트 및 IT 관리자를 위한 핵심 내용은 다음과 같습니다.자본 지출 감소: 별도의 400G 장거리 모듈을 제거하여 혼합 거리 설계에서 광학 지출을 30-40% 절감합니다.운영 지출 단순화: 스페어 재고, 통합 진단 및 일관된 케이블링을 위한 단일 SKU.

  • 미래 보장:MMA4Z00-NS 800G OSFP SR8 트랜시버 솔루션
  • 은 오늘날의 800G 클러스터와 미래의 2x400G 패브릭을 모두 지원합니다.운영 유연성:
  • 소프트웨어 선택 가능한 모드를 통해 하드웨어 교체 없이 대역폭 대 거리를 재조정할 수 있습니다.