Với sự phát triển liên tục của công nghệ và nhu cầu ngày càng tăng cao, chip đồ họa (GPU) đang trở thành một lĩnh vực hái ra tiền. Công ty MosaicML vừa tuyên bố chip AMD MI250 có thể mang lại hiệu suất gần tương đương với A100 của Nvidia.
Các công ty sản xuất chip như Nvidia, AMD, Intel đều đang đầu tư mạnh vào nghiên cứu và phát triển để cung cấp hiệu suất đồ họa ngày càng tốt hơn và đáp ứng được nhu cầu đa dạng của người dùng và các ngành công nghiệp khác nhau. Một công bố gần đây cho thấy chip AMD MI250 có thể mang lại hiệu suất gần tương đương với A100 của Nvidia.
Các chip đồ họa đóng một vai trò quan trọng không chỉ trong lĩnh vực sản xuất các ứng dụng game và phim ảnh, mà còn không thể thiếu trong các lĩnh vực như Thiết kế đồ họa, đào tạo Trí tuệ nhân tạo Tính toán khoa học, và nhiều ứng dụng khác.
MosaicML là một công ty khởi nghiệp về AI gần đây đã được công ty Databricks mua lại với giá 1,3 tỷ USD. Cả hai công ty đều ủng hộ cách tiếp cận DIY đối với các hệ thống AI và nền tảng đào tạo LLM, cho phép các công ty duy trì quyền kiểm soát các ứng dụng AI của họ.
Sự gia tăng vốn hóa thị trường gần đây của Nvidia đã cho thấy, ngành công nghiệp AI đang rất cần phần cứng mới để đào tạo các mô hình ngôn ngữ lớn (LLM) và các thuật toán dựa trên AI khác. Hãng đã đạt được những thành công đáng kể với mẫu chip Nvidia A100.
Mặc dù GPU của máy chủ và HPC (High-Performance Computing – Điện toán hiệu năng cao) có thể không thực sự mang lại nhiều giá trị khi chơi game, nhưng chúng đóng vai trò là nền tảng cho trung tâm dữ liệu.
Các siêu máy tính thực hiện tính toán song song yêu cầu hiệu suất cao lại rất cần thiết cho các hệ thống này.
Khi nói đến đào tạo AI, GPU của Nvidia là sản phẩm đáng mong đợi nhất cho đến nay. Đây cũng là lý do, công ty đã nhanh chóng đạt được mức vốn hóa thị trường kỷ lục lên đến 1 nghìn tỷ đô la trong thời gian gần đây.
Tuy nhiên, MosaicML hiện nhấn mạnh rằng Nvidia chỉ là một lựa chọn trong thị trường phần cứng, rằng các công ty đầu tư vào AI không nên chi quá nhiều tiền một cách mù quáng vào những con chip đang được săn đón bởi Team Green (Đội đua của Kawasaki).
Bằng chứng, startup AI này đã thực hiện bài kiểm tra với 2 card đồ họa AMD MI250 và Nvidia A100, cả hai đều sử dụng thế hệ sau GPU HPC hàng đầu hiện tại của mỗi công ty. Họ đã sử dụng các công cụ phần mềm của riêng mình, cùng với phần mềm mã nguồn mở được hỗ trợ bởi Meta là PyTorch và phần mềm độc quyền của AMD để thử nghiệm.
MosaicML đã đào tạo thuật toán LLM mà không thực hiện bất kỳ thay đổi nào đối với mã phần mềm cơ bản của cả 2 chip đồ họa và nhận thấy rằng khả năng hoạt động của chip AMD và chip Nvidia là gần tương đương nhau.
Trong các thử nghiệm dựa trên khối lượng công việc thực tế, MosaicML báo cáo rằng quá trình đào tạo LLM vẫn ổn định và hoạt động tốt mà không cần bất kỳ cấu hình bổ sung nào. Công ty cho biết GPU MI250 sẽ là dòng sản phẩm có tính “cạnh tranh cao” của AMD.
Mỗi chip AMD MI250 có khả năng cung cấp 80% thông lượng dữ liệu được cung cấp bởi mẫu A100 40 GB và khoảng 73% so với mẫu A100 800 GB tương ứng của Nvidia.
Hanlin Tang, giám đốc công nghệ của MosaicML, nói rằng điểm yếu lớn nhất đối với hầu hết các công ty sản xuất chip để tăng tốc thuật toán ML là ở phần mềm của họ. AMD đã xuất sắc trong lĩnh vực này và công ty đang mong đợi hiệu năng thậm chí còn tốt hơn trên các GPU HPC mới khi các công cụ phần mềm tiếp tục được cải thiện.
Tuy nhiên, cần lưu ý rằng CUDA – Giao diện lập trình ứng dụng cấp thấp của Nvidia, đã trở thành một tiêu chuẩn trong ngành, ít nhất là cho đến thời điểm hiện tại. CUDA không hoàn hảo hay dễ dàng sử dụng, nhưng nó quen thuộc và chỉ dành cho Nvidia.
Điều này dường như xác thực chiến lược của AMD trong nỗ lực phát triển hệ sinh thái phần mềm mở và dễ triển khai để doanh nghiệp đào tạo các hệ thống AI suy luận trên dòng chip của họ. Hiện tại, Nvidia chưa đưa ra bất kỳ bình luận về phát hiện được công bố của MosaicML.
(Theo Alfonso Maruccia)