OpenAI đã phát hành mô hình AI được chờ đợi từ lâu, trước đây có tên mã là “Strawberry”. Mô hình này có hiệu suất tương đương với sinh viên Tiến sĩ trong các bài kiểm tra chuẩn đầy thách thức về vật lý, hóa học và sinh học.
Như dự đoán, mô hình mới có tên “OpenAI o1-preview” — một cách đặt tên hoàn toàn mới của công ty — được thiết kế để dành nhiều thời gian hơn để “suy nghĩ” trước khi trả lời, mở rộng giới hạn của các “nhiệm vụ phức tạp” và “vấn đề khó” mà nó có thể giải quyết, theo một cập nhật từ công ty.
Mô hình này đã từ lâu được đồn đoán là một đột phá trong nỗ lực của công ty nhằm đạt được trí tuệ nhân tạo tổng hợp, điểm lý thuyết mà tại đó AI có thể vượt qua con người. Mục tiêu là mang lại khả năng “lý luận” cho mô hình, cho phép nó giải các bài toán phức tạp hơn, chẳng hạn như trong toán học.
Và nếu tin vào công ty, nó đã có những kỹ năng học thuật ấn tượng. OpenAI khẳng định rằng mô hình này “có hiệu suất tương đương với sinh viên Tiến sĩ trong các bài kiểm tra chuẩn đầy thách thức về vật lý, hóa học và sinh học.”
Nhưng đúng như tên gọi, OpenAI o1-preview vẫn đang ở giai đoạn đầu và sẽ có nhiều bản cập nhật trong tương lai.
“Vì là mô hình đầu tiên, nên nó chưa có nhiều tính năng làm cho ChatGPT hữu ích, như khả năng duyệt web để lấy thông tin và tải lên tệp hoặc hình ảnh,” công ty viết. “Trong nhiều trường hợp phổ biến, GPT-4o sẽ mạnh mẽ hơn trong thời gian ngắn.”
Hiện tại, OpenAI o1 sẽ có sẵn cho người dùng ChatGPT Plus và Team. Công ty cũng đang lên kế hoạch giới thiệu một phiên bản nhẹ hơn, gọi là o1-mini, cho tất cả người dùng miễn phí của ChatGPT, nhưng vẫn chưa tiết lộ khi nào điều đó sẽ xảy ra.
OpenAI cho biết họ đã thiết kế mô hình AI mới nhất với sự an toàn được đặt lên hàng đầu. Trong một trong những bài kiểm tra “thoát bảo mật” khó nhất, mô hình mới đạt 84/100 điểm, so với chỉ 22 điểm của GPT-4o.
“Mô hình mới đã được đào tạo bằng một thuật toán tối ưu hóa hoàn toàn mới và một tập dữ liệu huấn luyện mới được thiết kế riêng cho nó,” Jerry Tworek, người đứng đầu nhóm nghiên cứu của OpenAI nói.
Công ty cho biết o1 có thể được sử dụng “bởi các nhà nghiên cứu y tế để chú thích dữ liệu giải trình tự tế bào, bởi các nhà vật lý để tạo ra các công thức toán học phức tạp cần thiết cho quang học lượng tử, và bởi các nhà phát triển ở mọi lĩnh vực để xây dựng và thực thi các quy trình đa bước.”
Nhờ vào quy trình “chuỗi suy nghĩ” mới của nó, mô hình này đánh giá một số câu trả lời cho một truy vấn trước khi chọn câu trả lời tốt nhất. Và điều đó có thể mất một khoảng thời gian, đặc biệt khi so với các câu trả lời gần như ngay lập tức mà chúng ta nhận được từ ChatGPT.
Trong một buổi demo, mô hình mất 30 giây để giải một câu đố lý luận liên quan đến tuổi của một công chúa và hoàng tử.
Về khả năng “ảo tưởng” thông tin, một vấn đề nổi cộm từng gây khó khăn cho các chatbot AI, OpenAI có vẻ thực tế hơn.
“Chúng tôi nhận thấy rằng mô hình này ít ảo tưởng hơn,” Tworek nói. Nhưng “chúng tôi không thể nói rằng chúng tôi đã giải quyết được vấn đề ảo tưởng.”
Giám đốc điều hành của công ty, Sam, cũng đã đưa ra nhận định về mô hình mới, nói rằng nó “vẫn còn thiếu sót, vẫn còn hạn chế, và nó vẫn ấn tượng hơn trong lần sử dụng đầu tiên so với sau khi bạn sử dụng nó trong một thời gian dài.”
Một người hỏi liệu nó có đạt đến trí tuệ nhân tạo tổng hợp (AGI) không. “Không,” ông trả lời.