Các GPU siêu máy tính của Nvidia được thiết kế để tăng tốc các tác vụ nặng trong trung tâm dữ liệu và nghiên cứu khoa học.
Các nhà nghiên cứu Trung Quốc đã đạt được hiệu suất cao gần gấp 10 lần so với siêu máy tính Mỹ dùng chip Nvidia, theo một nghiên cứu được bình duyệt.
Thành tựu này thách thức sự thống trị lâu năm của chip Mỹ trong nghiên cứu khoa học tiên tiến, đồng thời cho thấy hậu quả không mong muốn của lệnh trừng phạt công nghệ từ Washington.
Vượt qua ‘nút thắt’ công nghệ
Theo South China Morning Post, một số chuyên gia cho rằng tối ưu hóa phần mềm không thể thay thế hoàn toàn khoảng cách về phần cứng.
Sự phát triển này phản ánh chiến lược rộng hơn của Bắc Kinh nhằm giảm rủi ro phụ thuộc vào công nghệ chip phương Tây giữa bối cảnh Mỹ gia tăng trừng phạt.
Những lĩnh vực cần tài nguyên tính toán lớn như dự báo lũ lụt hay phân tích ngập úng đô thị sẽ chịu ảnh hưởng mạnh bởi hạn chế về phần cứng.
Việc sản xuất các GPU tiên tiến như Nvidia A100 và H100 chủ yếu do nước ngoài kiểm soát, trong khi Mỹ hạn chế xuất khẩu khiến Trung Quốc gặp nhiều trở ngại.
Ngoài ra, Nvidia còn hạn chế phần mềm CUDA hoạt động trên phần cứng bên thứ ba, cản trở sự phát triển của thuật toán độc lập.
Giải pháp dựa trên phần mềm
Giáo sư Nan Tongchao tại Đại học Hohai, Nam Kinh, đã nghiên cứu phương pháp tính toán song song “đa nút, đa GPU” để tăng hiệu suất siêu máy tính.
Nhóm của ông tối ưu hóa việc trao đổi dữ liệu giữa các nút, giảm thiểu tổn thất hiệu suất khi xử lý song song.
Năm 2021, Phòng thí nghiệm Oak Ridge (Mỹ) phát triển mô hình dự báo lũ TRITON trên siêu máy tính Summit, nhưng chỉ đạt hiệu suất gấp 6 lần dù dùng 64 nút.
Trong khi đó, kiến trúc của Nan ghép nhiều GPU vào một nút duy nhất để khắc phục hạn chế của phần cứng nội địa, giảm đáng kể độ trễ truyền dữ liệu.
Hệ thống này chạy trên nền tảng x86 nội địa với bộ xử lý Hygon 7185 (32 lõi, 64 luồng, xung nhịp 2,5 GHz), GPU nội địa 128GB RAM và băng thông mạng 200 Gb/s. Mô hình đạt tốc độ gấp 6 lần chỉ với 7 nút, giảm 89% số nút so với TRITON.
Nhóm nghiên cứu đã mô phỏng quá trình diễn biến lũ tại hồ chứa Zhuangli, Sơn Đông, sử dụng 200 nút tính toán và 800 GPU, hoàn thành chỉ trong 3 phút.
Nan cho biết: “Việc mô phỏng lũ trên quy mô lưu vực chỉ trong vài phút giúp cải thiện khả năng phòng chống thiên tai, quản lý hồ chứa và giảm thiểu thiệt hại.”
Mã nguồn nghiên cứu được công khai và có thể ứng dụng vào các mô phỏng khác như khí tượng thủy văn, trầm tích và tương tác nước mặt – nước ngầm.