Devin AI, Kỹ sư phần mềm tự động hoàn toàn, được trang bị một số khả năng tiên tiến trong phát triển phần mềm, bao gồm viết mã, gỡ lỗi, giải quyết vấn đề, v.v. Đây là tất cả những gì bạn cần biết về nó.
Cognition, một phòng thí nghiệm AI ứng dụng có trụ sở tại Mỹ, đã giới thiệu cái mà họ tuyên bố là kỹ sư phần mềm AI đầu tiên trên thế giới. Các nhà sản xuất cho biết AI Agent, có tên là Devin AI, đã vượt qua các phỏng vấn kỹ thuật thực tế do các công ty AI hàng đầu tổ chức.
Nó cũng đã hoàn thành các công việc thực tế được đăng trên Upwork, một nền tảng việc làm freelance có trụ sở tại Mỹ, theo thông tin từ Cognition. Kỹ sư phần mềm AI này có thể xây dựng và triển khai ứng dụng từ đầu đến cuối.
“Devin là một đồng đội tài năng, không biết mệt mỏi, sẵn sàng xây dựng cùng bạn hoặc tự động hoàn thành nhiệm vụ để bạn xem xét. Nói cách khác, nó có thể đảm nhận các qui trình trong kỹ thuật phần mềm tự động (plan, workspace, command line, browser, fix bug, deploy app,…).
Với Devin, các kỹ sư có thể tập trung vào các vấn đề thú vị hơn và các nhóm kỹ thuật có thể theo đuổi các mục tiêu lớn hơn,” theo bài đăng trên blog chính thức của công ty về Devin AI.
Devin có thể làm gì?
AI Agent này sở hữu những tính năng tiên tiến trong phát triển phần mềm, bao gồm: Viết mã, gỡ lỗi, giải quyết vấn đề, v.v. Devin AI sử dụng các thuật toán học máy để liên tục học và cải thiện hiệu suất của mình và thích ứng với những thách thức mới.
Nói một cách đơn giản, Devin có thể xây dựng và triển khai ứng dụng từ đầu đến cuối và cũng có thể huấn luyện và điều chỉnh mô hình AI của chính nó.
Devin có thể lên kế hoạch và thực hiện các nhiệm vụ kỹ thuật phức tạp mà sẽ yêu cầu hàng nghìn quyết định. Điều này là có thể nhờ vào sự tiến bộ của Cognition trong việc tư duy và lập kế hoạch dài hạn. Theo công ty, Devin có thể nhớ lại ngữ cảnh liên quan ở mỗi bước, tự học qua thời gian và thậm chí sửa các lỗi.
Bên cạnh đó, những người sáng tạo còn trang bị cho kỹ sư phần mềm AI khả năng hợp tác tích cực với người dùng. Nó báo cáo tiến độ trong thời gian thực, có khả năng chấp nhận phản hồi và làm việc cùng người dùng trong việc lựa chọn thiết kế khi cần.
Hiệu suất của nó ra sao?
Trên bảng điểm SWE-Bench (một bảng điểm để đánh giá các mô hình ngôn ngữ lớn trong thế giới thực về các vấn đề phần mềm được tìm thấy trên GitHub), Devin AI đã giải quyết đúng 13,86 % của các vấn đề mà không cần sự trợ giúp so với 1,96 % không có sự trợ giúp và 4,80 % được hỗ trợ của mô hình tiên tiến trước đó.
Về hiệu suất, Devin AI có khả năng tăng cường hiệu suất và tốc độ trong quy trình phát triển phần mềm bằng cách tự động hóa các nhiệm vụ lặp lại, tạo mã nguồn ngay lập tức, tăng tốc độ tiến độ dự án và giảm chi phí phát triển một cách đáng kể.
Một trong những khía cạnh đáng chú ý nhất của Devin AI là nó không bị ảnh hưởng bởi các lỗi hoặc thiếu đồng nhất của con người. AI Agent có khả năng đảm bảo độ chính xác và đồng nhất trong các thực hành lập trình có thể dẫn đến việc phát triển các sản phẩm phần mềm chất lượng cao hơn.
Cần lưu ý rằng công ty chưa tiết lộ bất kỳ thông tin nào về mô hình AI đang vận hành Devin AI, cũng như không tiết lộ các thông số kỹ thuật chi tiết. Một số công cụ AI phổ biến khác giúp trong việc viết mã là OpenAI Codex, GitHub Copilot, Polycoder, CodeT5, Tabnine, v.v.
Thách thức và cơ hội mà nó mang lại?
Mặc dù công ty đã nói về các khả năng của Devin, một số chuyên gia cảm thấy rằng kỹ sư phần mềm AI này có thể gặp khó khăn với các yêu cầu phức tạp hoặc những trường hợp cần đến trực giác và sự sáng tạo của con người.
Bên cạnh đó, các công cụ AI như Devin dường như gây ra lo ngại về việc mất việc làm. Tuy nhiên, một số người tin rằng Devin AI có thể là một đồng minh cho hàng ngàn kỹ sư phần mềm, mở ra những cơ hội hợp tác mới giữa trí tuệ con người và trí tuệ nhân tạo.
Cognition, công ty đứng sau Devin, do Scott Wu đứng đầu. Cognition là một phòng thí nghiệm AI ứng dụng tập trung vào lý luận. Công ty cho biết họ đang xây dựng các đồng đội AI có khả năng vượt qua các công cụ AI hiện có.
“Xây dựng Devin chỉ là bước đầu tiên, những thách thức khó khăn nhất của chúng tôi vẫn còn phía trước,” trang web công ty cho biết. Công cụ sẽ sớm sẵn sàng cho thuê để phục vụ các công việc kỹ thuật, nhưng hiện tại, các công ty cần tham gia danh sách chờ.