NVIDIA Network Adapter Solutions: RDMA và kiến trúc RoCE để tối ưu hóa truyền tải độ trễ thấp
October 15, 2025
Trong môi trường máy tính dữ liệu chuyên sâu ngày nay, các giao thức mạng truyền thống tạo ra các nút thắt đáng kể cho các ứng dụng hiệu suất cao.Các giải pháp chuyển đổi mạng của NVIDIA với công nghệ RDMA và RoCE cung cấp cải tiến hiệu suất đột phá cho các trung tâm dữ liệu hiện đại và khối lượng công việc AI.
Khi các tổ chức triển khai các mô hình AI ngày càng phức tạp và khối lượng công việc phân tích dữ liệu, các ngăn xếp mạng TCP / IP thông thường sẽ giới hạn hiệu suất ứng dụng.Các hạn chế chính bao gồm::
- CPU overhead từ xử lý giao thức mạng
- Các hạn chế băng thông bộ nhớ trong quá trình chuyển dữ liệu
- Sự chậm trễ ứng dụng do độ trễ ngăn xếp mạng
- Các hạn chế về khả năng mở rộng trong triển khai quy mô lớn
Truy cập bộ nhớ trực tiếp từ xa (RDMA) cho phép chuyển dữ liệu trực tiếp từ bộ nhớ sang bộ nhớ giữa các hệ thống mà không liên quan đến hệ điều hành hoặc bộ xử lý.
- Chuyển dữ liệu không sao chép loại bỏ các bản sao đệm
- Bỏ qua lõi để giảm việc sử dụng CPU
- Truyền thông quá chậm giữa các ứng dụng
- Khả năng xử lý tốc độ tin nhắn cao
RoCE mở rộng các lợi ích RDMA đến các mạng Ethernet tiêu chuẩn, làm cho mạng hiệu suất cao có thể truy cập mà không cần cơ sở hạ tầng chuyên dụng.
- RoCE v2 cho định tuyến qua mạng Layer 3
- Các cơ chế kiểm soát tắc nghẽn tiên tiến
- Việc ưu tiên chất lượng dịch vụ (QoS)
- Tích hợp liền mạch với cơ sở hạ tầng Ethernet hiện có
NVIDIA adapter mạng với RDMA và RoCE chứng minh cải thiện hiệu suất đáng kể trên nhiều trường hợp sử dụng:
Kịch bản ứng dụng | Ethernet truyền thống | NVIDIA RDMA/RoCE | Cải thiện |
---|---|---|---|
Truyền thông đào tạo AI | 85-120 microsecond | 1.2-1.8 microsecond | ~ 98% giảm |
Kho lưu trữ truy cập độ trễ | 45-65 microsecond | 00,8-1,5 microsecond | ~ 97% giảm |
Sử dụng CPU | 25-40% cho mỗi cảng | 1-3% cho mỗi cảng | ~90% giảm |
Giải pháp mạng NVIDIA kết hợp các thành phần phần cứng và phần mềm để cung cấp hiệu suất tối ưu:
- Các bộ điều hợp mạng dòng ConnectX với tải phần cứng
- BlueField DPU để tích hợp xử lý và bảo mật
- trình điều khiển NVIDIA và SDK để tích hợp ứng dụng
- Các công cụ quản lý triển khai và giám sát
Việc triển khai thành công các giải pháp RDMA và RoCE của NVIDIA đòi hỏi phải lập kế hoạch cẩn thận:
- Cơ sở hạ tầng mạng hỗ trợ DCB và PFC
- Cấu hình QoS thích hợp cho Ethernet không mất mát
- Tối ưu hóa ứng dụng cho ngữ nghĩa RDMA
- Các quy trình thử nghiệm và xác nhận toàn diện
Các giải pháp chuyển đổi mạng của NVIDIA với công nghệ RDMA và RoCE đại diện cho nền tảng cho cơ sở hạ tầng mạng hiệu suất cao thế hệ tiếp theo.Những công nghệ này cho phép các tổ chức vượt qua các hạn chế mạng truyền thống và mở ra tiềm năng đầy đủ của các khoản đầu tư máy tính của họ.Tìm hiểu thêmvề việc thực hiện các giải pháp này trong môi trường của bạn.