Mellanox hợp tác với NVIDIA: Tăng tốc các trung tâm dữ liệu AI
October 9, 2025
NVIDIA Mellanox Synergy: Cách mạng hóa hiệu suất trung tâm dữ liệu AI với mạng GPU tiên tiến
Sự tích hợp của máy tính tăng tốc của NVIDIA với mạng lưới hiệu suất cao của Mellanox đang tạo ra một mô hình mới cho cơ sở hạ tầng trung tâm dữ liệu AI,cung cấp khả năng mở rộng và hiệu quả chưa từng có cho khối lượng công việc AI doanh nghiệp.
Nền tảng chuyển đổi trung tâm dữ liệu AI
Sự sáp nhập của NVIDIA và Mellanox đánh dấu một sự thay đổi quan trọng trong kiến trúc trung tâm dữ liệu.các tổ chức bây giờ có thể xây dựng môi trường máy tính tăng tốc từ đầu đến cuối được thiết kế đặc biệt cho trí tuệ nhân tạoSự phối hợp này giải quyết nút thắt quan trọng trong máy tính hiện đại: chuyển động dữ liệu.
GPU Networking: Các Critical Performance Multiplier
Các mạng trung tâm dữ liệu truyền thống phải vật lộn với nhu cầu xử lý song song khổng lồ của AI.NVIDIA Mellanoxgiải pháp tận dụng hai công nghệ chính để vượt qua điều này:
- InfiniBand: Cung cấp khả năng tính toán trong mạng thông qua Scalable Hierarchical Aggregation and Reduction Protocol (SHARP), giảm thời gian không hoạt động của GPU bằng cách giảm tải các hoạt động giảm từ CPU.
- Chuyển đổi Ethernet phổ: Cung cấp hỗ trợ RoCE tiên tiến (RDMA trên Ethernet hội tụ), cho phép giao tiếp GPU-to-GPU ở tốc độ dòng với độ trễ cực thấp, cần thiết cho đào tạo phân tán.
Cách tiếp cận này biến mạng từ một đường ống thụ động thành một thành phần tích cực, thông minh của cơ sở hạ tầng máy tính.
Tác động có thể định lượng đối với khối lượng công việc AI
Lợi ích hiệu suất từ sự tích hợp chặt chẽ có thể đo lường và có ý nghĩa trên các chỉ số chính:
| Phương pháp đo | Cơ sở hạ tầng truyền thống | Trung tâm dữ liệu AI NVIDIA Mellanox | Cải thiện |
|---|---|---|---|
| Hiệu quả đào tạo phân tán | ~40-50% | ~90% | 2x+ |
| Thời gian hoàn thành công việc (Mô hình lớn) | 5 ngày | ~20 giờ | 6 lần nhanh hơn |
| Dữ liệu thông lượng (mỗi nút) | 100 Gb/s | 400 Gb/s (HDR) | 4 lần cao hơn |
Kiến trúc tương lai: Nền tảng Trung tâm dữ liệu AI thống nhất
Tầm nhìn mở rộng ra ngoài các thành phần riêng lẻ.NVIDIA Mellanoxphương pháp bao gồm:
- NVIDIA DGX Systems: Máy chủ AI tích hợp với NVLink và NVSwitch cho băng thông nội bộ.
- Mellanox ConnectX-6 NIC thông minh: Cung cấp CPU giảm tải và an toàn, cổng tốc độ cao đến mạng.
- Mellanox Quantum Switch: 400G HDR InfiniBand chuyển đổi tạo thành xương sống vải độ trễ thấp.
- Các thư viện MPI và NCCL CUDA-Aware: Phần mềm cho phép các ứng dụng tận dụng mạng lưới tăng tốc này một cách liền mạch.
Nền tảng gắn kết này đảm bảo rằng dữ liệu chảy hiệu quả từ lưu trữ thông qua mạng đến bộ nhớ GPU, tối đa hóa việc sử dụng và ROI trên các tài nguyên tính toán AI đắt tiền.
Tóm lại và giá trị chiến lược
Sự hợp tác giữaNVIDIA Mellanoxkhông chỉ là một sự tích hợp sản phẩm; nó là một kiến trúc lại cơ bản củaTrung tâm dữ liệu AINó mang lại giá trị hữu hình bằng cách:
- Giảm đáng kể thời gian giải quyết cho các mô hình AI phức tạp.
- Cho phép triển khai quy mô của hàng ngàn GPU cho các vấn đề lớn.
- Cải thiện tổng chi phí sở hữu (TCO) thông qua việc sử dụng tài nguyên cao hơn đáng kể.
- Cơ sở hạ tầng dự phòng tương lai cho thế hệ công việc AI tiếp theo.
Đối với bất kỳ doanh nghiệp nào nghiêm túc về việc tận dụng AI trên quy mô, tối ưu hóaMạng GPUkhông còn là tùy chọn mà là bắt buộc.

