NVIDIA Mellanox MCX653106A-HDAT 서버 어댑터 실제 적용: RDMA/RoCE 저지연 전송 및 서버

April 30, 2026

에 대한 최신 회사 뉴스 NVIDIA Mellanox MCX653106A-HDAT 서버 어댑터 실제 적용: RDMA/RoCE 저지연 전송 및 서버

현대 데이터센터 환경에서 분산 스토리지와 고주파 트레이딩에서 대규모 AI 교육 클러스터에 이르기까지 전통적인 TCP/IP 프로토콜 스택은 주요 병목이되었습니다.커널 네트워킹의 오버헤드, 데이터 복사 및 컨텍스트 스위칭은 예측할 수없는 대기 시간을 도입하면서 상당한 CPU 자원을 소비합니다.이 사례 연구는 선도적인 클라우드 인프라 제공자가NVIDIA 멜라녹스 MCX653106A-HDAT서버 NIC, 대기 시간과 처리량 모두에서 극적인 향상을 달성합니다.

배경과 도전: TCP/IP 병목

제공자의 기존 25GbE 인프라, 표준 TCP를 실행, NVMe-oF 저장 트래픽과 실시간 분석 작업 부하에 발맞추기 위해 고군분투했다.스토리지 노드에서의 CPU 사용량은 네트워크 처리에만 70%를 초과합니다., 응용 프로그램 로직에 대한 충분한 헤드프레스를 남겨두고. 계산 및 저장 노드 사이의 끝에서 끝까지의 지연 시간은 50~150 마이크로초 사이로 변동,서비스 레벨 계약에 영향을 미치는 꼬리 지연 스파이크를 유발합니다.엔지니어링 팀은 네트워크 아키텍처의 근본적인 변화가 필요하다는 것을 인식했습니다. 커널을 우회하고 엔드포인트 간의 직접 메모리 액세스를 가능하게 하는 것.

솔루션: RoCE와 함께 MCX653106A-HDAT를 배포

여러 가지 옵션을 평가 한 후 팀은MCX653106A-HDAT 이더넷 어댑터 카드연결X-6 아키텍처를 기반으로, 이MCX653106A-HDAT ConnectX 어댑터 PCIe 네트워크 카드RoCE (RDMA over Converged Ethernet) 의 네이티브 하드웨어 지원과 함께 듀얼 포트 100GbE 연결을 제공합니다. 배포는 단계적 접근 방식을 따르고 있습니다.

  • 1단계저장 노드 (10 노드 Ceph를 실행) 에 있는 오래된 NIC를 새로운 어댑터로 교체합니다.
  • 단계 2:NIC 및 톱 오브 랙 스위치 모두에서 DCB (위선 흐름 제어 및 ETS) 를 사용하여 손실 없는 이더넷을 구성합니다.
  • 단계 3:TCP 소켓에서 RDMA 기반 동사와 NVMe-oF를 RoCE로 응용 프로그램 트래픽을 마이그레이션합니다.
  • 단계 4:실시간 분석을 처리하는 컴퓨팅 노드로 배포를 확장합니다.

컨설팅 엔지니어MCX653106A-HDAT 데이터 시트그리고MCX653106A-HDAT 사양기존 Mellanox 스위치 조직과 배포 된 리눅스 배포판 (MLNX_OFED 드라이버와 Ubuntu 22.04) 과 완전한 호환성을 확인했습니다.MCX653106A-HDAT 호환성이 생태계는 NIC 자체를 교체하는 것 이외에 하드웨어 변경이 필요하지 않은 포괄적 인 것으로 나타났습니다.

결과와 이점: 측정 가능한 변화

배치 후 테스트는 모든 주요 메트릭에서 상당한 개선이 나타났습니다. 다음 표는 이전과 후 비교를 요약합니다.

메트릭 이전 (25GbE TCP) (MCX653106A-HDAT RoCE) 이후 개선
평균 지연 (P99) 120μs 8 μs 93% 감소
저장 노드 CPU (네트워크 경로) ~65% ~12% 5.4배 감소
NVMe-oF 읽기 처리량 (노드당) 18Gb/s 96 Gb/s 5.3배 증가
메시지 속도 (64B 패킷) 15 Mpps 215 Mpps 14.3배 증가

이 양적 이득 외에도 연구팀은 몇 가지 질적 이점을 관찰했습니다.MCX653106A-HDAT 이더넷 어댑터 카드 솔루션애플리케이션 메모리와 원격 저장장치 사이의 진정한 제로 복사 데이터 이동을 가능하게 하며, 이전에는 트래픽 폭발 중에 간헐적인 고장을 일으킨 버퍼 고갈 문제를 제거했습니다.분석 작업 부하에 대해, RDMA로 이전하여 작업 완료 시간을 62% 감소시켜 비즈니스 결과를 직접적으로 향상시킵니다.MCX653106A-HDAT 가격전체 소유 비용에 비해 저장 노드 수의 30% 감소 (노드당 높은 효율성으로 인해) 는 9 개월 이내에 수익을 얻었습니다.MCX653106A-HDAT 판매또한 NVIDIA 파트너를 통해 DOCA 프레임워크에 대한 액세스를 포함하여 사용자 정의 네트워크 기능에 대한 미래 프로그래밍 기능을 해제합니다.

결론과 전망: 차세대 인프라를 위한 기초

개발에 관한NVIDIA 멜라녹스 MCX653106A-HDAT제공자의 인프라를 TCP 제한 환경에서 현대 작업 부하를 지원 할 수있는 고성능, 낮은 지연 시간 조직으로 전환했습니다.,PCIe 4.0 인터페이스와 포괄적인 소프트웨어 생태계는 오늘날의 데이터 센터의 세 가지 중요한 요구 사항을 해결합니다.

이와 비슷한 업그레이드를 평가하는 건축가들에게는MCX653106A-HDAT 호환성스위치, 케이블 및 운영 체제를 포함한 부품MCX653106A-HDAT 데이터 시트통합 계획에 대한 전력, 열 및 기계적 사양을 제공합니다. 200GbE 섬유가 표준화되고 AI 훈련 클러스터가 점점 낮은 대기 시간을 요구함에 따라MCX653106A-HDAT 이더넷 어댑터 카드검증된, 생산에 견고한 솔루션으로 준비되어 있습니다. 공급자는 이제 인공지능 추론 작업 부하를 위한 GPU 직접 RDMA를 포함하도록 배포를 확장하고 있습니다.이 어댑터를 현대 데이터 센터 아키텍처의 초석으로 더 검증합니다..