InfiniBand trong HPC: Những lợi thế của Mellanox QM9700
October 9, 2025
Mellanox QM9700 InfiniBand Switch Thiết Lập Chuẩn Mực Mới cho Mạng HPC Thế Hệ Tiếp theo
DÀNH CHO PHÁT HÀNH NGAY LẬP TỨC
Sunnyvale, CA – Nhu cầu không ngừng về sức mạnh tính toán trong các cụm Điện toán Hiệu năng cao (HPC) và AI hiện đại đang đẩy cơ sở hạ tầng mạng đến giới hạn của chúng. Để giải quyết vấn đề này, việc áp dụng công nghệ InfiniBand tốc độ cao, độ trễ thấp đã trở thành tiêu chuẩn thực tế để kết nối các siêu máy tính mạnh nhất thế giới. Bộ phận Mellanox của NVIDIA, một người tiên phong trong lĩnh vực này, một lần nữa đã nâng tầm với việc giới thiệu switch lượng tử Mellanox QM9700, một nền tảng cho kỷ nguyên tiếp theo của mạng HPC.
Hiệu suất và Khả năng mở rộng chưa từng có cho các khối lượng công việc đòi hỏi khắt khe
Mellanox QM9700 được thiết kế để phục vụ như một cấu trúc nền tảng cho cơ sở hạ tầng điện toán exascale. Nó hỗ trợ NDR (Tốc độ Dữ liệu Tiếp theo) InfiniBand, cung cấp tốc độ dữ liệu thô đáng kinh ngạc là 400 Gb/s trên mỗi cổng và thông lượng hai chiều tổng hợp là 162,6 Tb/s trong một switch 40 cổng duy nhất. Điều này thể hiện bước nhảy vọt về hiệu suất gấp 4 lần so với thế hệ HDR trước đó. Đối với các ứng dụng HPC và AI, điều này có nghĩa là giảm đáng kể thời gian đào tạo cho các mô hình phức tạp và thời gian giải quyết nhanh hơn cho các mô phỏng khoa học, cho phép các nhà nghiên cứu giải quyết các vấn đề trước đây được cho là không thể giải quyết được.
Mellanox QM9700: Đi sâu vào Ưu điểm Kiến trúc
Ngoài tốc độ thô, Mellanox QM9700 kết hợp một số cải tiến kiến trúc quan trọng, củng cố vị thế dẫn đầu của nó trong mạng HPC:
- Định tuyến thích ứng và Công nghệ SHARP: Switch có tính năng định tuyến thích ứng nâng cao để tự động tránh các đường dẫn bị tắc nghẽn, đảm bảo luồng dữ liệu tối ưu. Việc hỗ trợ Giao thức Tổng hợp và Giảm thiểu Phân cấp Khả năng mở rộng (SHARP) làm giảm chi phí hoạt động MPI bằng cách giảm tải các hoạt động tập thể từ CPU sang switch mạng, tăng tốc hiệu suất lên đến 50% đối với các ứng dụng sử dụng nhiều tin nhắn.
- Hỗ trợ RoCE và Đo từ xa Nâng cao: Phần mềm NVIDIA NetQ tích hợp cung cấp khả năng hiển thị sâu sắc về hiệu suất mạng, cho phép quản lý chủ động và chẩn đoán nhanh chóng. Mặc dù là một trung tâm InfiniBand, QM9700 cũng cung cấp hỗ trợ mạnh mẽ cho RoCE (RDMA qua Ethernet hội tụ), mang lại sự linh hoạt cho các môi trường trung tâm dữ liệu không đồng nhất.
- Hiệu quả về Điện năng và Làm mát: Mặc dù có sức mạnh to lớn, switch được thiết kế với hiệu quả, có tính năng tối ưu hóa điện năng ở cấp độ cổng giúp giảm tiêu thụ năng lượng lên đến 30% so với các hệ thống cũ, giảm đáng kể Tổng chi phí sở hữu (TCO).
Tác động có thể định lượng được đối với các Ứng dụng HPC và AI trong thế giới thực
Các số liệu hiệu suất của Mellanox QM9700 chuyển đổi trực tiếp thành các lợi ích hữu hình trên nhiều lĩnh vực:
| Lĩnh vực ứng dụng | Số liệu hiệu suất | Cải thiện với QM9700 NDR InfiniBand |
|---|---|---|
| Mô hình khí hậu | Thời gian cho mỗi mô phỏng | Giảm 40% |
| Giải trình tự bộ gen | Thông lượng xử lý dữ liệu | Tăng 3,8 lần |
| Đào tạo Mô hình Ngôn ngữ Lớn (LLM) | Thời gian hoàn thành công việc | Giảm 60% |
Kết luận và Giá trị Chiến lược cho Doanh nghiệp và Tổ chức Nghiên cứu
Switch lượng tử NVIDIA Mellanox QM9700 không chỉ là một bản cập nhật gia tăng; nó là một yếu tố hỗ trợ chiến lược cho thập kỷ khám phá tính toán tiếp theo. Bằng cách cung cấp băng thông chưa từng có, độ trễ cực thấp và các khả năng mạng thông minh, nó loại bỏ nút thắt cổ chai về mạng đã từng hạn chế hiệu suất cụm. Đối với các tổ chức đầu tư vào nghiên cứu AI, mô phỏng điện toán lượng tử hoặc phân tích dữ liệu quy mô lớn, việc triển khai cấu trúc InfiniBand NDR được neo bởi QM9700 là một bước đi dứt khoát hướng tới việc đạt được hiệu quả cấp exascale và duy trì lợi thế cạnh tranh.

