NVIDIA Mellanox MCX653105A-HDAT Server Adapter hoạt động: Tăng hiệu suất thông qua RDMA / RoCE Low-Latency Transport

March 16, 2026

tin tức mới nhất của công ty về NVIDIA Mellanox MCX653105A-HDAT Server Adapter hoạt động: Tăng hiệu suất thông qua RDMA / RoCE Low-Latency Transport
Bối cảnh & Thách thức: Khó khăn về lưu trữ và tính toán

Một công ty công nghệ tài chính hàng đầu, trong khi xây dựng nền tảng phân tích dữ liệu lớn thế hệ tiếp theo, gặp phải các nút chai I / O mạng nghiêm trọng.Cơ sở hạ tầng 10GbE hiện có đã phải vật lộn để xử lý luồng dữ liệu khổng lồ cần thiết cho đánh giá rủi ro thời gian thực và phân tích giao dịch tần số caoCác lõi CPU đã dành đến 30% chu kỳ của họ chỉ quản lý lưu lượng mạng, để lại ít tài nguyên hơn cho xử lý ứng dụng quan trọng.để mở rộng quy mô cơ sở dữ liệu phân tán và phân tích dựa trên AI, họ cần phải giảm đáng kể độ trễ và tăng hiệu quả máy chủ thông lượng mà không cần sửa chữa toàn bộ đội máy chủ của họ.

Mạng TCP/IP truyền thống không còn khả thi.ảnh hưởng trực tiếp đến hiệu suất của cơ sở dữ liệu trong bộ nhớ và các cụm lưu trữ dựa trên NVMeCông ty cần một giải pháp có thể tải xử lý mạng từ CPU và cho phép di chuyển dữ liệu trực tiếp, tốc độ cao giữa máy chủ và lưu trữ.quyết định được đưa raNVIDIA Mellanox MCX653105A-HDATmáy chủ adapter card qua các nút tính toán và lưu trữ quan trọng của họ.

Giải pháp và triển khai: Giải phóng khả năng RDMA và RoCE

Việc triển khai tập trung vàoMCX653105A-HDAT, một bộ chuyển đổi hai cổng 100Gb / s từ gia đình NVIDIA Mellanox ConnectX-6. Mục tiêu chính là thực hiện RDMA trên Converged Ethernet (RoCE) để bỏ qua CPU để chuyển dữ liệu.NVIDIA Mellanox MCX653105A-HDATđược chọn vì hỗ trợ phần cứng gốc cho RoCE, cung cấp các lợi ích độ trễ thấp của InfiniBand trong khi hoạt động trên một mô Ethernet tiêu chuẩn,đảm bảo khả năng tương thích với các công tắc mạng hiện có.

Nhóm kỹ sư đã cấu hình các máy chủ trong một cấu hình hàng đầu, cho phép kết nối bất cứ nơi nào với hiệu suất dự đoán.MCX653105A-HDAT Ethernet adapter cardBằng cách sử dụng phần cứng dựa trên RoCE offloads,Nhóm thiết lập một vải không mất mát với kiểm soát dòng chảy ưu tiên (PFC) để đảm bảo không rơi gói, một yêu cầu quan trọng cho hoạt động RDMA hiệu quả.MCX653105A-HDAT ConnectX adapter thẻ mạng PCIeđã được chứng minh là rất quan trọng ở đây, vì các cơ chế kiểm soát tắc nghẽn tiên tiến của nó duy trì sự ổn định của vải ngay cả dưới tải đầy đủ.

Kết quả đo lường: Thăng tốc thông lượng và sụp đổ độ trễ

Việc nâng cao hiệu suất là ngay lập tức và đáng kể. Trước khi nâng cấp, cơ sở hạ tầng 10GbE hiện có đã giới hạn tốc độ truyền giữa máy chủ với khoảng 1,2 GB / s với việc sử dụng CPU cao.Sau khi tích hợpMCX653105A-HDATCác bộ điều chỉnh và cho phép RoCEv2, cụm đạt được những điều sau:

Phương pháp đo Trước đó (10GbE/TCP) Sau (100GbE/RoCE với MCX653105A-HDAT)
Tăng hiệu quả (NVMe-oF) ~1.1 GB/s ~ 11,5 GB/s
Độ trễ trung bình (đi lại) ~ 150 μs < 5 μs
CPU sử dụng (I/O mạng) ~30% < 5%

Sự gia tăng 10 lần này trong thông lượng đã đạt được trong khi đồng thời giải phóng các lõi CPU cho xử lý cấp độ ứng dụng.MCX653105A-HDATCác khả năng RDMA đã giúp các cơ sở dữ liệu phân tán có thể mở rộng theo chiều ngang mà không cần thêm máy chủ.như chi tiết trong văn bản chính thứcMCX653105A-HDAT thông số kỹ thuật, cho phép chuyển giao trực tiếp từ bộ nhớ sang bộ nhớ, bỏ qua lõi và cắt giảm độ trễ đến mức trước đây chỉ được nhìn thấy trong các cụm HPC chuyên biệt.Bảng dữ liệu MCX653105A-HDATđể tinh chỉnh các tham số PCIe, đảm bảo sử dụng băng thông Gen4 tối ưu.

Kết luận và triển vọng tương lai

Việc triển khai này chứng minh rằngGiải pháp thẻ adapter MCX653105A-HDAT Ethernetkhông chỉ là một nâng cấp từng bước mà là một yếu tố chuyển đổi cho các doanh nghiệp dựa trên dữ liệu.MCX653105A-HDATđã cho phép công ty tối đa hóa giá trị của các khoản đầu tư lưu trữ và tính toán hiện tại. thành công đã mở đường cho việc mở rộng triển khai các cụm đào tạo học máy của họ,trong đó các đặc điểm chậm củaMCX653105A-HDAT để bánĐối với các kiến trúc sư và kỹ sư đánh giá cơ sở hạ tầng hiệu suất cao,MCX653105A-HDAT tương thíchbản chất với các hệ điều hành hiện có và các công cụ quản lý làm cho nó trở thành một sự lựa chọn liền mạch để xây dựng các trung tâm dữ liệu hiện đại, công suất cao.