기술 솔루션: Mellanox를 이용한 RDMA/RoCE 저지연 및 처리량 최적화

March 13, 2026

기술 솔루션: Mellanox를 이용한 RDMA/RoCE 저지연 및 처리량 최적화
1프로젝트 배경 및 요구 분석

현대 데이터 센터는 분산 데이터베이스, 고성능 컴퓨팅 (HPC),인공지능 교육 클러스터전통적인 TCP/IP 네트워크는 상당한 CPU 오버헤드를 부과하여 애플리케이션 확장성을 제한하고 응답 시간을 증가시키는 병목을 만듭니다.인프라를 현대화하려는 조직을 위해, 핵심 요구 사항은 명확합니다: 비용이 많이 드는 구조 개정 없이 대기 시간을 줄이고 서버 처리량을 증가시킵니다.

해결책은 컨버지드 이더넷 (RoCE) 상에서 RDMA (Remote Direct Memory Access) 를 채택하는 데 있습니다. 이 기술은 직접적인 메모리-메모리 데이터 전송을 가능하게 합니다.운영 체제 커널을 우회하여 CPU 자원을 자유롭게하고 대기 시간을 최소화합니다.이 변화의 중심에는 네트워크 인터페이스 카드 (NIC) 가 있습니다.MCX631432AN-ADABMellanox (NVIDIA) 에서 제작된 이 제품은 이러한 요구사항을 충족시키기 위해 특별히 설계되었으며, RoCE가 가능한 직물들을 위한 견고한 기반을 제공합니다.

2전체 네트워크 및 시스템 아키텍처 설계

제안된 아키텍처는 손실 없는 이더넷 환경을 위해 설계된 잎 척추 조직으로 최적의 RoCEv2 성능의 전제 조건입니다.설계는 통일된 컴퓨터와 저장 트래픽을 통합합니다.복잡성과 비용을 줄이기 위한 고속조직

  • 척추 층:고 용량 100GbE 스위치는 모든 잎 스위치 사이에 차단되지 않는 연결을 제공하여 모든 낮은 지연 경로를 보장합니다.
  • 잎층:25GbE 다운링크가 있는 탑 오프 랙 (ToR) 스위치는 서버와 스토리지 노드에 연결된다.이 스위치는 손실 없는 조직을 유지하기 위해 우선 흐름 제어 (PFC) 와 명시적 혼잡 알림 (ECN) 으로 구성되어 있습니다..
  • 서버 계층:각 서버는NVIDIA 멜라녹스 MCX631432AN-ADAB, 듀얼 포트 25GbE SFP28 어댑터. 이것은 네트워크 결합 또는 저장 및 컴퓨팅 트래픽을위한 별도의 경로를 허용합니다.

이 설계는MCX631432AN-ADAB 이더넷 어댑터 카드RoCE 트래픽이 패킷 손실 없이 흐를 수 있는 환경에서 작동합니다. 이는 높은 처리량과 낮은 대기 시간을 유지하는 데 중요합니다.

3MCX631432AN-ADAB의 역할

MCX631432AN-ADAB전체 솔루션을 가능하게 하는 중요한 엔드포인트입니다. ConnectX-6 Lx 가족의 일원으로서 25GbE 형식 요소에 엔터프라이즈 수준의 기능을 제공합니다.MCX631432AN-ADAB 이더넷 어댑터 카드 솔루션컴퓨팅 트래픽과 스토리지 트래픽 모두에서 서버 CPU에서 네트워크 작업의 오프로드.

어댑터의 주요 기술 기여는 다음과 같습니다.

  • 하드웨어 출하:카드는 운송, 캡슐화 및 혼잡 제어 등 하드웨어에서 RoCE 프로토콜의 모든 측면을 처리합니다. 이것은 RDMA 작업이 거의 제로 CPU 주기를 소비하는 것을 보장합니다.
  • 듀얼 포트 유연성:이중 25GbE 포트는 활성/준비 상태에서 오류 전환을 위해 구성되거나 트래픽 유형을 분리하는 데 사용할 수 있습니다. 예를 들어,하나의 포트는 프론트 엔드 이더넷 트래픽을 처리 할 수 있으며 다른 하나는 RoCE를 사용하여 백 엔드 스토리지 트래픽에 전용됩니다., 처리량과 보안을 극대화
  • PCIe 3.0 x16 호스트 인터페이스:두 25GbE 포트를 동시에 구동 할 수있는 충분한 대역폭으로,MCX631432AN-ADAB 커넥트X-6 Lx 듀얼 포트 25GbE SFP28내부 병목이 애플리케이션 성능을 제한하지 않도록 합니다.
4배포 및 확장 권고

개발 및 개발MCX631432AN-ADAB네트워크 조직과 서버 구성에 대한 신중한 계획이 필요합니다. 다음 단계에서는 고성능 클러스터의 전형적인 배포를 설명합니다.

  • 직물 제조:배포 전에 RoCE를 지원하도록 네트워크 스위치를 구성합니다. 이것은 RoCE 트래픽 클래스에 대한 PFC를 활성화하고 ECN 기반 혼잡 관리 구현을 포함합니다.이것은 최적의 성능을 위해 어댑터가 필요한 손실 없는 환경을 만듭니다.
  • 드라이버 및 펌웨어 설치:최신 NVIDIA WinOF-2 드라이버 (Windows) 또는 MLNX_OFED (리눅스) 를 설치하여 기능을 완벽하게 지원합니다.MCX631432AN-ADAB최적의 RoCE 성능과 호환성을 위해 최신입니다.
  • 클러스터 확장:이 아키텍처는 더 많은 서버 노드를 추가함으로써 수평적으로 확장되며 각 노드는 자체 MCX631432AN-ADAB을 가지고 있습니다.막지 않는 잎 척추 조직은 추가 된 노드가 기존의 노드의 성능을 저하시키지 않도록합니다.더 큰 배포를 위해, 링크 집계 그룹 (LAG) 은 잎과 척추 스위치 사이에 사용될 수 있습니다.

데이터베이스 클러스터의 전형적인 토폴로지는 기본 서버와 복제 서버를 동일한 페이지 스위치에 연결하여 랙 간 지연 시간을 최소화하는 것을 포함한다.각 서버는 두 개의 분리 된 잎 스위치에 연결하기 위해 이중 포트 어댑터를 사용합니다..

5운영 모니터링, 문제 해결 및 최적화

한 번 배치되면 성능을 유지하려면 능동적인 모니터링과 조정이 필요합니다.MCX631432AN-ADAB이 목적을 위해 종합적인 텔레메트리를 제공합니다.

  • 모니터링 핵심 메트릭포트 카운터, 링크 오류 및 RDMA 트래픽 통계를 모니터링하기 위해 `mlxstat` 및 `ethtool`와 같은 도구를 사용하십시오. PFC 일시 중지 프레임을 추적하는 것이 중요합니다.높은 수치는 RoCE 성능을 저하시키는 손실 직물을 나타냅니다..
  • 펌웨어 및 드라이버 업데이트:업데이트를 정기적으로 확인합니다. 새로운 펌웨어에는 종종 대기 시간을 추가로 줄이고 상류 스위치와의 호환성을 향상시킬 수있는 성능 최적화 및 버그 수정 기능이 포함되어 있습니다.
  • 성능 조정:가장 까다로운 대기 요구 사항이 있는 환경에서는 정교한 인터럽트 모더레이션과 버퍼 크기가 증가된 이득을 가져올 수 있습니다.어댑터의 유연성은 건축가들이 그들의 특정 작업 부하에 따라 설정을 선택 할 수 있습니다.예를 들어, HPC 대 가상화).

연결 문제 해결을 위해 SFP28 모듈이MCX631432AN-ADAB 호환성NVIDIA 자격을 갖춘 광학을 사용하는 것은 신뢰할 수 있는 링크 구축과 성능을 보장합니다.

6요약 및 가치 평가

MCX631432AN-ADABMellanox (NVIDIA) 에서 고성능, 낮은 지연 시간 네트워크 구조를 구현하는 명확하고 효과적인 경로를 제공합니다.조직은 급격히 CPU 오버헤드를 줄이고 크게 서버 처리량을 증가 두 배의 혜택을 얻을 수 있습니다. 상세한MCX631432AN-ADAB 사양그리고MCX631432AN-ADAB 데이터 시트가장 까다로운 작업 부하를 처리할 수 있는 능력을 검증합니다.

하드웨어 업데이트를 평가하는 IT 관리자와 네트워크 아키텍트에게 이 솔루션이 제공하는 성능 향상은 비즈니스 가치로 직접 번역됩니다. 더 빠른 트랜잭션 처리,보다 효율적인 저장 접근데이터 요구가 계속 증가함에 따라MCX631432AN-ADAB네트워크 인프라가 병목이 아니라 가속기가 되는 것을 보장합니다.MCX631432AN-ADAB 가격사용 가능성은 NVIDIA 담당자에게 문의하세요.