NVIDIA 네트워크 어댑터 솔루션: 저지연 전송 최적화를 위한 RDMA 및 RoCE 아키텍처

October 15, 2025

에 대한 최신 회사 뉴스 NVIDIA 네트워크 어댑터 솔루션: 저지연 전송 최적화를 위한 RDMA 및 RoCE 아키텍처
NVIDIA 네트워크 어댑터 솔루션: RDMA 및 RoCE 아키텍처

오늘날의 데이터집약적인 컴퓨팅 환경에서 전통적인 네트워크 프로토콜은 고성능 애플리케이션에 상당한 병목을 만듭니다.RDMA 및 RoCE 기술을 가진 NVIDIA의 네트워크 어댑터 솔루션은 현대 데이터 센터 및 AI 워크로드에 대한 획기적인 성능 향상을 제공합니다..

고성능 컴퓨팅에서 네트워크 지연의 도전

조직이 점점 더 복잡한 AI 모델과 데이터 분석 작업 부하를 배포함에 따라, 기존 TCP/IP 네트워크 스택은 애플리케이션 성능을 제한하는 상당한 오버헤드를 도입합니다.주요 한계에는:

  • 네트워크 프로토콜 처리로 인한 CPU 오버헤드
  • 데이터 전송 중 메모리 대역폭 제한
  • 네트워크 스택 지연으로 인한 애플리케이션 지연
  • 대규모 배포에서 확장성 제한
NVIDIA RDMA 기술 개요

리모트 다이렉트 메모리 액세스 (RDMA) 는 운영 체제 또는 프로세서를 포함시키지 않고 시스템 간의 직접 메모리-메모리 데이터 전송을 가능하게합니다.

  • 버퍼 복사본을 제거하는 제로 복사 데이터 전송
  • CPU 사용량을 줄이기 위한 커널 우회
  • 애플리케이션 간의 초저연속 통신
  • 높은 메시지 처리 속도
RoCE (RDMA over Converged Ethernet) 아키텍처

RoCE는 RDMA 혜택을 표준 이더넷 네트워크로 확장하여 전문 인프라 없이도 고성능 네트워킹을 이용할 수 있습니다. NVIDIA의 RoCE 구현에는 다음이 포함됩니다.

  • 레이어 3 네트워크를 통해 라우팅을 위한 RoCE v2
  • 첨단 혼잡 통제 메커니즘
  • 서비스 품질 (QoS) 우선 순위
  • 기존 이더넷 인프라와 원활한 통합
실제 응용 프로그램에서의 성능 장점

RDMA와 RoCE를 가진 NVIDIA 네트워크 어댑터는 여러 사용 사례에서 상당한 성능 향상을 보여줍니다:

적용 시나리오 전통적인 이더넷 NVIDIA RDMA/RoCE 개선
인공지능 교육 커뮤니케이션 85~120 마이크로초 10.2-1.8 마이크로초 ~98% 감소
스토리지 액세스 지연 45~65 마이크로초 00.8-1.5 마이크로초 ~97% 감소
CPU 사용량 항구당 25~40% 항구당 1-3% ~90% 감소
구현 아키텍처

NVIDIA 네트워크 솔루션은 최적의 성능을 제공하기 위해 하드웨어와 소프트웨어 구성 요소를 결합합니다.

  • 하드웨어 오프로드가 있는 ConnectX 시리즈 네트워크 어댑터
  • 통합 처리 및 보안을 위한 블루필드 DPU
  • NVIDIA 드라이버 및 SDK 응용 프로그램 통합
  • 배포 및 모니터링을 위한 관리 도구
배치 최선 사례

NVIDIA RDMA 및 RoCE 솔루션의 성공적인 구현은 신중한 계획을 필요로 합니다.

  • DCB와 PFC를 지원하는 네트워크 인프라
  • 손실 없는 이더넷을 위한 적절한 QoS 구성
  • RDMA 의미에 대한 응용 프로그램 최적화
  • 종합적인 시험 및 검증 절차

NVIDIA의 RDMA 및 RoCE 기술을 가진 네트워크 어댑터 솔루션은 차세대 고성능 네트워크 인프라의 기초를 나타냅니다.이러한 기술은 조직이 전통적인 네트워크 한계를 극복하고 컴퓨팅 투자의 잠재력을 최대한 발휘할 수 있도록 합니다..더 알아보기이러한 솔루션을 여러분의 환경에서 구현하는 것에 대해