Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 trong hành động: Tối ưu hóa kết nối liên kết độ trễ thấp cho các cụm RDMA / HPC / AI
April 14, 2026
Trong thời đại đào tạo mô hình AI quy mô lớn và HPC exascale, độ trễ mạng đã nổi lên như một nút thắt quan trọng nhất hạn chế khả năng mở rộng cụm tuyến tính.,cácMellanox 920-9B110-00FH-0D0InfiniBand Switch đang thay đổi cách các tổ chức nghiên cứu và các phòng thí nghiệm AI doanh nghiệp thiết kế các loại vải hiệu suất cao của họ.920-9B110-00FH-0D0cung cấp độ trễ cực thấp, cực thấp cho khối lượng công việc RDMA.
Hậu trường & Thách thức: Bức tường truyền thông AI Cluster
Một cơ sở nghiên cứu AI cỡ trung bình đã phải vật lộn với thời gian không hoạt động của GPU trong quá trình đào tạo phân tán trên 64 nút.gây ra các hoạt động truyền thông tập thể (tất cả giảmCác kiến trúc sư mạng cần một giải pháp không mất mát, công suất cao có thể mở rộng đến 200Gb / s mỗi cổng trong khi duy trì độ trễ dưới microsecond.Sau khi đánh giá các lựa chọn có sẵn, nhóm đã chọn920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDRnhư là khối xây dựng cốt lõi cho topology lá xương sống mới của họ.
Giải pháp & triển khai: Thực hiện InfiniBand Fabric
Việc triển khai tập trung vàoNVIDIA Mellanox 920-9B110-00FH-0D0Mỗi nút tính toán được trang bị bộ điều hợp HDR ConnectX-6, kết nối với các công tắc lá thông qua cáp đồng thụ động.Các bước thực hiện chính bao gồm:
- RDMA qua Ethernet hội tụ (RoCE) thay thế:InfiniBand gốc với kiểm soát tắc nghẽn dựa trên phần cứng loại bỏ hoàn toàn việc giảm gói.
- Đường dẫn thích nghi:Các920-9B110-00FH-0D0 Giải pháp OPN chuyển đổi InfiniBandcho phép cân bằng tải năng động trên nhiều đường dẫn, ngăn ngừa sự hình thành điểm nóng.
- Quản lý vải:Sử dụng Subnet Manager (OpenSM) vớiCác thông số kỹ thuật 920-9B110-00FH-0D0xác nhận hỗ trợ tối đa 2.000 nút trong một fabric duy nhất.
Trước khi mua sắm, các kỹ sư đã xem xét các920-9B110-00FH-0D0để xác nhận khả năng tương thích với quang học hiện có.920-9B110-00FH-0D0 tương thíchHệ sinh thái bao gồm tất cả các bộ lắp ráp cáp HDR lớn, đơn giản hóa hóa đơn vật liệu.Giá 920-9B110-00FH-0D0chứng minh khả năng cạnh tranh với các công tắc HDR thay thế và các đơn vị có sẵn (920-9B110-00FH-0D0 để bán) thông qua các đối tác kênh NVIDIA.
Kết quả & Lợi ích: Lợi ích hiệu suất có thể đo lường
Phân tích từ xa sau khi triển khai cho thấy sự cải thiện đáng kể trong ba chỉ số chính:
| Phương pháp đo | Trước (100GbE) | Sau (920-9B110-00FH-0D0 HDR) | Cải thiện |
|---|---|---|---|
| Tỷ lệ trễ giảm tất cả (64 nút) | 340μs | 78μs | Giảm 77% |
| Thời gian không hoạt động của GPU (chi phí liên lạc) | 38% | 11% | 27% lợi nhuận tuyệt đối |
| Sử dụng băng thông chất liệu hiệu quả | 62% | 94% | +32% |
Ngoài các con số thô,920-9B110-00FH-0D0 InfiniBand switch OPNcho phép nhóm mở rộng quy mô từ 64 đến 256 nút mà không cần thiết kế lại mô hình.Thời gian trễ xác định được cung cấp bởi kiểm soát dòng chảy dựa trên tín dụng của InfiniBand đã được chứng minh là rất cần thiết để duy trì tính nhất quán đào tạo trên hàng trăm GPUCác kỹ sư cũng tận dụng920-9B110-00FH-0D0Thông báo tắc nghẽn dựa trên phần cứng để xác định và khắc phục micro-burst trong thời gian thực.
Tóm lại & triển vọng: Tương lai của AI kết nối
Việc triển khai xác nhận rằngNVIDIA Mellanox 920-9B110-00FH-0D0phục vụ như là một yếu tố nền tảng cho thế hệ AI và HPC cluster tiếp theo. Bằng cách thay thế các mô Ethernet mất mát bằng InfiniBand không mất mát,các tổ chức có thể phục hồi lên đến 30% của GPU tính toán trước đây lãng phí trên các gian hàng truyền thôngĐối với các kiến trúc sư lập kế hoạch cơ sở hạ tầng AI mới,920-9B110-00FH-0D0cung cấp hướng dẫn chi tiết về topology từ các cụm DGX nhỏ đến triển khai quy mô siêu máy tính.
Khi khối lượng công việc phát triển hướng tới sự song song mô hình lớn hơn và mật độ GPU cao hơn,920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDRcung cấp một con đường nâng cấp rõ ràng cho các loại vải 400Gb / s trong tương lai thông qua thiết kế tương thích ngược.Giá 920-9B110-00FH-0D0chống lại hiệu quả hoạt động tăng hoặc xác minh920-9B110-00FH-0D0 tương thíchtùy chọn cáp, chuyển đổi InfiniBand này cung cấp ROI có thể đo lường cho các tổ chức dữ liệu.

