Giải pháp kỹ thuật thiết bị mạng Mellanox (NVIDIA Mellanox) 980-9I510-00NS00
April 21, 2026
Khi trí tuệ nhân tạo, điện toán hiệu năng cao và lưu trữ phân tán phát triển nhanh chóng, các trung tâm dữ liệu và mạng doanh nghiệp đang chịu áp lực chưa từng có. Các kiến trúc mạng truyền thống thường gặp khó khăn với ba thách thức cốt lõi: độ trễ không thể đoán trước trong các đợt bùng nổ lưu lượng đông-tây, cơ chế dự phòng liên kết không đủ dẫn đến gián đoạn dịch vụ và thiếu khả năng đo lường sâu để quản lý lỗi chủ động. Các nhóm vận hành CNTT yêu cầu một giải pháp mang lại độ tin cậy cấp nhà mạng, khả năng chuyển đổi dự phòng dưới mili giây và khả năng quan sát toàn diện — mà không yêu cầu phải đại tu hoàn toàn cơ sở hạ tầng cáp hiện có. Sản phẩm 980-9I510-00NS00 từ Mellanox (NVIDIA Mellanox) trực tiếp giải quyết các yêu cầu này, cung cấp nền tảng sẵn sàng cho tương lai cho các môi trường quan trọng.
Kiến trúc được đề xuất áp dụng cấu trúc vật lý spine-leaf, được công nhận rộng rãi là tiêu chuẩn ngành cho các trung tâm dữ liệu hiện đại. Trong thiết kế này, các switch leaf kết nối trực tiếp với máy chủ, hệ thống lưu trữ và thiết bị biên, trong khi các switch spine cung cấp kết nối toàn bộ giữa tất cả các nút leaf. Sản phẩm NVIDIA Mellanox 980-9I510-00NS00 đóng vai trò là cả thành phần spine và leaf, đảm bảo hiệu suất và quản lý nhất quán trên mọi cấp độ. Kiến trúc hai lớp, không chặn này loại bỏ nhu cầu về các giao thức spanning-tree và giảm độ trễ hop xuống mức tối thiểu tuyệt đối. Đối với mạng khuôn viên doanh nghiệp, cùng một thiết bị có thể được triển khai dưới dạng lõi sụp đổ, tổng hợp lưu lượng từ các switch phân phối trong khi duy trì tính sẵn sàng cao thông qua Giao thức dự phòng định tuyến ảo (VRRP) và tổng hợp liên kết dựa trên phần cứng.
Trọng tâm của giải pháp kỹ thuật này là sản phẩm mạng 980-9I510-00NS00, một thiết bị mạng mật độ cao, độ trễ thấp được thiết kế cho khả năng sẵn sàng 200G/400G. Theo tờ dữ liệu 980-9I510-00NS00 và thông số kỹ thuật 980-9I510-00NS00, thiết bị cung cấp 32 cổng 200G, khả năng chuyển đổi dự phòng liên kết dựa trên phần cứng (dưới 1ms) và khả năng đo lường toàn diện thông qua gRPC. Các yếu tố khác biệt chính bao gồm:
- Độ trễ xác định cực thấp: Độ trễ cổng-tới-cổng dưới 300ns, rất quan trọng đối với giao dịch tần suất cao và NVMe qua Fabrics.
- Các tính năng sẵn sàng cao nâng cao: Chuyển đổi dự phòng không gián đoạn, theo dõi trạng thái liên kết phần cứng và các mô-đun nguồn/quạt dự phòng kép.
- Đo lường sâu & khả năng lập trình: Đo lường mạng trong băng (INT) và phân tích luồng cho phép hiển thị thời gian thực về các đợt bùng nổ nhỏ và độ sâu hàng đợi.
- Khả năng tương thích liền mạch: Thiết bị tương thích 980-9I510-00NS00 với nhiều loại bộ thu phát và cáp, bảo vệ các khoản đầu tư hiện có.
Khi kết hợp lại, các tính năng này cho phép mạng tốc độ cao trung tâm dữ liệu 980-9I510-00NS00 hỗ trợ các khối lượng công việc đòi hỏi cao như cụm huấn luyện AI, sao chép cơ sở dữ liệu quy mô lớn và cơ sở hạ tầng siêu hội tụ.
Đối với một trung tâm dữ liệu cỡ trung bình điển hình (200–500 máy chủ), chúng tôi khuyến nghị triển khai bốn switch spine và tám switch leaf, tất cả đều dựa trên NVIDIA Mellanox 980-9I510-00NS00. Mỗi switch leaf kết nối với mọi switch spine bằng các liên kết 200G, tạo ra một cấu trúc liên kết toàn bộ với tỷ lệ quá tải 4:1 (hoặc 1:1 nếu thêm các switch spine). Máy chủ và thiết bị lưu trữ kết nối với các switch leaf thông qua cáp chia 25G/100G hoặc kết nối trực tiếp 200G. Thiết kế này hỗ trợ tới 256 cổng máy chủ ở 100G mỗi cổng, với khả năng mở rộng tuyến tính bằng cách thêm nhiều khối leaf. Đối với mạng doanh nghiệp, thiết kế lõi sụp đổ kép với hai đơn vị sản phẩm mạng 980-9I510-00NS00 trong một cụm hoạt động-hoạt động cung cấp tính sẵn sàng cao cho tối đa 48 switch phân phối. Sơ đồ nâng giá đỡ chi tiết và ma trận cáp có sẵn theo yêu cầu, với bộ 980-9I510-00NS00 để bán bao gồm tất cả phần cứng lắp đặt và dây nguồn cần thiết.
Khi mở rộng, giải pháp tận dụng khả năng hỗ trợ VPN Ethernet (EVPN) và Virtual Extensible LAN (VXLAN) của thiết bị. Điều này cho phép các kiến trúc sư mạng mở rộng các miền lớp 2 trên các trung tâm dữ liệu hoặc các vùng khả dụng trên đám mây, cho phép di chuyển khối lượng công việc mà không cần tái cấu trúc các mạng con IP. Giải pháp sản phẩm mạng 980-9I510-00NS00 cũng có thể tích hợp với các switch Spectrum-2 và Spectrum-3 của NVIDIA, cung cấp một mặt phẳng quản lý hợp nhất cho các môi trường không đồng nhất.
Sản phẩm 980-9I510-00NS00 giảm đáng kể chi phí vận hành thông qua một số tính năng tích hợp. Thứ nhất, đo lường luồng thay thế việc thăm dò SNMP cũ, đẩy dữ liệu bộ đếm thời gian thực (độ trễ, mất gói, lỗi CRC, chiếm dụng bộ đệm) đến cơ sở dữ liệu chuỗi thời gian như Prometheus. Thứ hai, phần cứng hỗ trợ các cơ chế phát hiện lỗi nâng cao, bao gồm phát hiện liên kết chết (DLD) và chuyển đổi bảo vệ tự động (APS). Thứ ba, thông số kỹ thuật 980-9I510-00NS00 bao gồm hỗ trợ tập lệnh trên thiết bị dựa trên Python, cho phép tự động hóa tùy chỉnh cho các tác vụ như khởi động lại cổng khi có lỗi hoặc điều chỉnh cân bằng tải động.
Để khắc phục sự cố chủ động, người vận hành có thể bật INT trên các luồng cụ thể để thu thập thông tin độ trễ và hàng đợi trên mỗi hop. Điều này vô giá để xác định tình trạng tắc nghẽn do bùng nổ nhỏ — một vấn đề phổ biến trong mạng tốc độ cao mà các công cụ cũ không thể phát hiện. Quy trình tối ưu hóa điển hình: 1) Đặt đường cơ sở thông qua đo lường luồng trong 7 ngày, 2) Xác định 5% luồng có độ trễ cao nhất bằng INT, 3) Điều chỉnh băm ECMP hoặc áp dụng các tham số điều khiển luồng ưu tiên (PFC), 4) Đánh giá lại bằng cùng dữ liệu đo lường. Sản phẩm NVIDIA Mellanox 980-9I510-00NS00 cũng hỗ trợ khắc phục sự cố tự động thông qua webhooks, kích hoạt các playbook Ansible khi các ngưỡng suy giảm liên kết bị vượt qua.
| Nhiệm vụ vận hành | Cách tiếp cận cũ (Thời gian) | Với 980-9I510-00NS00 (Thời gian) |
|---|---|---|
| Phát hiện lỗi liên kết & chuyển đổi dự phòng | ~10 phút (thủ công) | < 1 giây (phần cứng) |
| Phân tích nguyên nhân gốc rễ bùng nổ nhỏ | Giờ / không thể | ~5 phút (INT) |
| Nâng cấp firmware trên toàn bộ mạng | 4–6 giờ (mỗi thiết bị) | 45 phút (cài đặt ảnh song song) |
Sản phẩm Mellanox (NVIDIA Mellanox) 980-9I510-00NS00 cung cấp một giải pháp kỹ thuật toàn diện cho các tổ chức tìm kiếm kết nối độ tin cậy cao và sự xuất sắc trong vận hành. Bằng cách tích hợp thiết bị này vào kiến trúc spine-leaf hoặc lõi sụp đổ, các nhóm mạng đạt được độ trễ dưới micro giây xác định, chuyển đổi dự phòng dựa trên phần cứng dưới một giây và đo lường chi tiết biến việc xử lý sự cố phản ứng thành tối ưu hóa chủ động. Khi đánh giá các quyết định đầu tư, giá 980-9I510-00NS00 nên được xem xét so với tổng chi phí sở hữu — giảm thời gian ngừng hoạt động (ước tính tiết kiệm 5+ giờ/năm), giảm nhân công vận hành (giảm 30% thời gian khắc phục sự cố) và khả năng sẵn sàng 400G trong tương lai. Đối với các kiến trúc sư và kỹ sư yêu cầu xác thực kỹ thuật sâu hơn, tờ dữ liệu 980-9I510-00NS00 hoàn chỉnh và các hướng dẫn triển khai tham khảo có sẵn thông qua các kênh chính thức.

