NVIDIA Network Adapter Solutions: RDMA và kiến trúc RoCE để tối ưu hóa truyền tải độ trễ thấp

October 15, 2025

tin tức mới nhất của công ty về NVIDIA Network Adapter Solutions: RDMA và kiến trúc RoCE để tối ưu hóa truyền tải độ trễ thấp
NVIDIA Network Adapter Solutions: RDMA và kiến trúc RoCE để tối ưu hóa truyền tải độ trễ thấp

Trong môi trường máy tính dữ liệu chuyên sâu ngày nay, các giao thức mạng truyền thống tạo ra các nút thắt đáng kể cho các ứng dụng hiệu suất cao.Các giải pháp chuyển đổi mạng của NVIDIA với công nghệ RDMA và RoCE cung cấp cải tiến hiệu suất đột phá cho các trung tâm dữ liệu hiện đại và khối lượng công việc AI.

Thách thức về độ trễ mạng trong máy tính hiệu suất cao

Khi các tổ chức triển khai các mô hình AI ngày càng phức tạp và khối lượng công việc phân tích dữ liệu, các ngăn xếp mạng TCP / IP thông thường sẽ giới hạn hiệu suất ứng dụng.Các hạn chế chính bao gồm::

  • CPU overhead từ xử lý giao thức mạng
  • Các hạn chế băng thông bộ nhớ trong quá trình chuyển dữ liệu
  • Sự chậm trễ ứng dụng do độ trễ ngăn xếp mạng
  • Các hạn chế về khả năng mở rộng trong triển khai quy mô lớn
NVIDIA RDMA Công nghệ tổng quan

Truy cập bộ nhớ trực tiếp từ xa (RDMA) cho phép chuyển dữ liệu trực tiếp từ bộ nhớ sang bộ nhớ giữa các hệ thống mà không liên quan đến hệ điều hành hoặc bộ xử lý.

  • Chuyển dữ liệu không sao chép loại bỏ các bản sao đệm
  • Bỏ qua lõi để giảm việc sử dụng CPU
  • Truyền thông quá chậm giữa các ứng dụng
  • Khả năng xử lý tốc độ tin nhắn cao
Kiến trúc RoCE (RDMA trên Ethernet hội tụ)

RoCE mở rộng các lợi ích RDMA đến các mạng Ethernet tiêu chuẩn, làm cho mạng hiệu suất cao có thể truy cập mà không cần cơ sở hạ tầng chuyên dụng.

  • RoCE v2 cho định tuyến qua mạng Layer 3
  • Các cơ chế kiểm soát tắc nghẽn tiên tiến
  • Việc ưu tiên chất lượng dịch vụ (QoS)
  • Tích hợp liền mạch với cơ sở hạ tầng Ethernet hiện có
Ưu điểm hiệu suất trong các ứng dụng thực tế

NVIDIA adapter mạng với RDMA và RoCE chứng minh cải thiện hiệu suất đáng kể trên nhiều trường hợp sử dụng:

Kịch bản ứng dụng Ethernet truyền thống NVIDIA RDMA/RoCE Cải thiện
Truyền thông đào tạo AI 85-120 microsecond 1.2-1.8 microsecond ~ 98% giảm
Kho lưu trữ truy cập độ trễ 45-65 microsecond 00,8-1,5 microsecond ~ 97% giảm
Sử dụng CPU 25-40% cho mỗi cảng 1-3% cho mỗi cảng ~90% giảm
Kiến trúc thực hiện

Giải pháp mạng NVIDIA kết hợp các thành phần phần cứng và phần mềm để cung cấp hiệu suất tối ưu:

  • Các bộ điều hợp mạng dòng ConnectX với tải phần cứng
  • BlueField DPU để tích hợp xử lý và bảo mật
  • trình điều khiển NVIDIA và SDK để tích hợp ứng dụng
  • Các công cụ quản lý triển khai và giám sát
Thực hành tốt nhất về triển khai

Việc triển khai thành công các giải pháp RDMA và RoCE của NVIDIA đòi hỏi phải lập kế hoạch cẩn thận:

  • Cơ sở hạ tầng mạng hỗ trợ DCB và PFC
  • Cấu hình QoS thích hợp cho Ethernet không mất mát
  • Tối ưu hóa ứng dụng cho ngữ nghĩa RDMA
  • Các quy trình thử nghiệm và xác nhận toàn diện

Các giải pháp chuyển đổi mạng của NVIDIA với công nghệ RDMA và RoCE đại diện cho nền tảng cho cơ sở hạ tầng mạng hiệu suất cao thế hệ tiếp theo.Những công nghệ này cho phép các tổ chức vượt qua các hạn chế mạng truyền thống và mở ra tiềm năng đầy đủ của các khoản đầu tư máy tính của họ.Tìm hiểu thêmvề việc thực hiện các giải pháp này trong môi trường của bạn.