Ứng dụng InfiniBand trong HPC: Ưu điểm của Mellanox QM9700
September 16, 2025
Cách mạng hóa máy tính hiệu suất cao: Mellanox QM9700 InfiniBand Switch thiết lập tiêu chuẩn mới trong mạng HPC
Sunnyvale, California.Mellanox Technologies, một công ty con của NVIDIA đã tung ra bộ chuyển đổi hàng loạt lượng tử QM9700, đại diện cho một bước nhảy vọt lượng tử trongInfiniBandcông nghệ cho môi trường máy tính hiệu suất cao.Mạng HPCGiải pháp cung cấp băng thông 400Gb / s chưa từng có trên mỗi cổng và công nghệ định tuyến thích nghi tiên tiến,Giảm độ trễ lên đến 40% so với các thế hệ trước trong khi cải thiện hiệu quả năng lượng lên đến 50% trong các cụm tính toán quy mô lớn.
Nhu cầu phát triển của khối lượng công việc HPC hiện đại
Khi các mô phỏng khoa học, đào tạo AI, và khối lượng công việc phân tích dữ liệu phát triển theo cấp số nhân trong sự phức tạp,Các cơ sở hạ tầng mạng truyền thống đang trở thành nút thắt chính trong môi trường máy tính hiệu suất caoNghiên cứu chỉ ra rằng trong các cụm vượt quá 10.000 nút, tắc nghẽn mạng có thể chiếm tới 45% chi phí tính toán,cản trở đáng kể thời gian giải quyết cho các dự án nghiên cứu quan trọng trong các lĩnh vực như mô hình hóa khí hậu, nghiên cứu dược phẩm, và vật lý thiên văn.
Mellanox QM9700: Thông số kỹ thuật và đổi mới
CácMellanox QM9700đại diện cho đỉnh cao củaInfiniBandcông nghệ, kết hợp một số đổi mới đột phá:
- Phạm vi băng thông chưa từng có:Hỗ trợ 400Gb / s mỗi cổng với kiến trúc không chặn cho băng thông hai phần đầy đủ
- Đường dẫn thích nghi nâng cao:Định hướng động giao thông xung quanh các con đường tắc nghẽn, cải thiện tổng thể sử dụng lên đến 95%
- Tăng khả năng mở rộng:Hỗ trợ các miền đơn siêu lớn vượt quá 50.000 nút mà không bị suy giảm hiệu suất
- Máy tính trong mạng:Công nghệ SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) chuyển tải các hoạt động tập thể từ CPU sang mạng
Các chỉ số so sánh hiệu suất: QM9700 so với các sản phẩm tiền nhiệm
Trong môi trường thử nghiệm có kiểm soát,Mellanox QM9700đã chứng minh sự cải thiện hiệu suất đáng kể so với các bộ chuyển đổi InfiniBand thế hệ trước:
| Chỉ số hiệu suất | Thế hệ trước | QM9700 | Cải thiện |
|---|---|---|---|
| Độ trễ (thông điệp 1000 byte) | 0.8 μs | 0.5 μs | 370,5% |
| Tỷ lệ tin nhắn (mỗi giây) | 180 triệu | 260 triệu | 440,4% |
| Hiệu quả năng lượng (Gb/s/watt) | 8.2 | 12.5 | 520,4% |
| Kích thước cụm tối đa | 16,000 nút | 50,000+ nút | 2120,5% |
Các ứng dụng và tác động trong thế giới thực
CácMellanox QM9700đã được triển khai tại nhiều trung tâm siêu máy tính trên toàn thế giới, chứng minh sự cải thiện đáng kể về hiệu suất ứng dụng.việc triển khai QM9700 trong cụm hàng đầu của họ dẫn đến giảm 42% thời gian giải quyết cho các mô phỏng động lực học chất lỏng phức tạpTương tự như vậy, một trung tâm dự báo thời tiết châu Âu báo cáo sự cải thiện 35% trong trao đổi dữ liệu giữa các nút tính toán, cho phép dự đoán thời tiết gần thời gian thực chính xác hơn.
Giá trị chiến lược cho cơ sở hạ tầng HPC
Đối với các tổ chức đầu tư vào cơ sở hạ tầng máy tính hiệu suất cao, cấu trúc mạng đại diện cho một yếu tố quyết định hiệu suất hệ thống tổng thể.InfiniBandgiải pháp cung cấp ROI hữu hình thông qua thời gian tính toán giảm, tiêu thụ năng lượng thấp hơn, và khả năng mở rộng cao hơn cho sự tăng trưởng trong tương lai.Các tổ chức nghiên cứu và doanh nghiệp có thể tăng tốc chu kỳ đổi mới và giải quyết các thách thức tính toán ngày càng phức tạp mà trước đây không thực tế do các hạn chế mạng.
Các bước tiếp theo cho các nhóm cơ sở hạ tầng HPC
Khi các yêu cầu tính toán tiếp tục tăng theo cấp số nhân, các giải pháp mạng cũ sẽ ngày càng trở nên không phù hợp với khối lượng công việc HPC hiện đại.Mạng HPCCác nhóm cơ sở hạ tầng đánh giá việc triển khai siêu máy tính thế hệ tiếp theo nên xem xét những lợi thế đã được chứng minh của QM9700InfiniBandkiến trúc.

