Sau khi ChatGPT của OpenAI khiến thế giới công nghệ mất cảnh giác vào cuối năm ngoái, Google đã tuyên bố “mã đỏ”, tranh giành để lên kế hoạch ứng phó với mối đe dọa mới. Dù việc ra mắt vào đầu năm nay với Bard AI không mấy suông sẻ, Google Duet AI hứa hẹn sẽ mang đến nhiều tính năng mới cho ứng dụng Workspace.
Tại Google I/O 2023, cuối cùng chúng ta cũng thấy một bức tranh chi tiết hơn về cách công ty nhìn nhận vai trò của AI đối với Bộ công cụ nâng cao hiệu suất dựa trên nền tảng đám mây của mình. Google Duet AI là thương hiệu của công ty cho bộ sưu tập các công cụ AI trên các ứng dụng Workspace.
Giống như các ứng dụng Microsoft Copilot cho Office, Duet AI là một thuật ngữ chung cho việc triển khai Generative AI trên các ứng dụng Google Workspace. Đầu tiên, ứng dụng Gmail dành cho thiết bị di động hiện sẽ soạn thảo các câu trả lời đầy đủ cho email của bạn dựa trên lời nhắc trong tính năng “Help me write” mới.
Ngoài ra, ứng dụng Gmail dành cho thiết bị di động sẽ sớm bổ sung hỗ trợ theo ngữ cảnh, “cho phép bạn tạo các câu trả lời chuyên nghiệp tự động điền tên và các thông tin liên quan khác”.
Duet AI cũng xuất hiện trong Google Slides. Ở đây, nó có dạng tạo hình ảnh cho bài thuyết trình của bạn. Giống như Midjourney hoặc DALL-E 2, Duet AI giờ đây có thể biến lời nhắc văn bản đơn giản (được nhập vào bảng điều khiển bên Duet AI “Sidekick”) thành hình ảnh do AI tạo ra để cải thiện bản trình bày Trang trình bày.
Nó có thể giúp bạn tránh khỏi rắc rối khi lùng sục trên mạng để tìm hình ảnh trang trình bày phù hợp giúp tăng tính thú vị và sáng tạo cho nội dung nguyên bản.
Trên Google Sheet, Duet AI có thể hiểu ngữ cảnh dữ liệu của một ô và gắn nhãn cho dữ liệu đó đó. Ứng dụng bảng tính cũng bổ sung tính năng “Help me organize” mới để tạo các kế hoạch tùy chỉnh: mô tả những gì bạn muốn làm bằng ngôn ngữ đơn giản và Duet AI sẽ vạch ra các chiến lược và các bước để hoàn thành nó.
Công ty cho biết: “Cho dù bạn là một team làm sự kiện đang lên kế hoạch cho một hội nghị bán hàng hàng năm hay một người quản lý điều phối một nhóm bên ngoài, Duet AI sẽ giúp bạn tạo các kế hoạch có tổ chức bằng các công cụ giúp bạn bắt đầu suôn sẻ”.
Trong khi đó, Duet AI trong Google Meet có thể tạo hình nền tùy chỉnh cho các cuộc gọi video bằng lời nhắc văn bản. Google cho biết tính năng này có thể giúp người dùng “thể hiện bản thân và tăng cường kết nối trong các cuộc gọi video đồng thời bảo vệ quyền riêng tư của môi trường xung quanh họ”.
Giống như việc tạo hình ảnh trên Slides, tích hợp Google Meet của Duet AI có thể là một lối tắt giúp bạn không phải tìm kiếm hình ảnh phông nền phù hợp cho cuộc họp của bạn (đồng thời ẩn mọi đối tượng không mong muốn phía sau bạn).
Duet AI nâng cao “trải nghiệm hỗ trợ soạn thảo văn bản” trong canvas thông minh của Google Document . Nhập lời nhắc mô tả nội dung bạn muốn viết sẽ tạo bản nháp trên Google Docs. Nó sẽ giúp đề xuất và tự động cung cấp thông tin về những thứ như tài liệu và những người được đề cập trong một dự án).
Ngoài ra, Google đang nâng cấp các công cụ kiểu Grammarly tích hợp sẵn của Google Docs, sẽ cung cấp các mẹo về cách viết ngắn gọn, tránh lặp lại và sử dụng ngữ điệu trang trọng hoặc tích cực hơn. Công ty cho biết thêm rằng bạn có thể dễ dàng tắt tính năng này khi bạn không muốn bị làm phiền.
Trước mắt, bạn sẽ phải đăng ký danh sách chờ để dùng thử các tính năng mới của Duet AI Workspace. Google cho biết bạn có thể đăng ký thông tin của mình tại đây để dùng thử các tính năng AI tổng quát cho nhiều người dùng trong những tuần tới.
Duet AI cũng bổ sung một bộ công cụ dành cho nhà phát triển Google Cloud dựa trên máy học. Nó có thể hỗ trợ viết mã theo thời gian thực và đề xuất chỉnh sửa mã. Công cụ này hỗ trợ các ngôn ngữ lập trình Go, Java, Javascript, Python và SQL.
Trong khi đó, Duet AI chat là một chatbot để trả lời các câu hỏi về viết code và Google Cloud. Cuối cùng, Google Vertex đang bổ sung các mô hình mới cho các nhà phát triển AI bao gồm: Codey, Imagen và Chirp.
Công ty đã công bố các mô hình mới cho các nhà phát triển và nhà khoa học dữ liệu, bao gồm Codey có thể giúp tăng tốc độ phát triển với khả năng hoàn thành và tạo mã theo thời gian thực, đồng thời hỗ trợ hơn 20 ngôn ngữ lập trình.
Thứ hai, Imagen là trình tạo hình ảnh, bao gồm nâng cấp, chỉnh sửa và chú thích tự động bằng hơn 300 ngôn ngữ.
Cuối cùng, Chirp cung cấp bản dịch giọng nói theo thời gian thực (dựa trên mô hình giọng nói hai tỷ tham số). Google cho biết “điều đó sẽ giúp các tổ chức tương tác với khách hàng và cử tri một cách toàn diện hơn bằng ngôn ngữ bản xứ của họ”. Ví dụ như sử dụng nó cho các trung tâm chuyên xử lý cuộc gọi và tạo video phụ đề.
“Chirp đạt được độ chính xác 98% đối với tiếng Anh và cải thiện tương đối tới 300% đối với các ngôn ngữ có dưới 10 triệu người nói,” công ty cho biết.
Cũng được đưa vào các thông báo về Cloud AI là API Nhúng cho văn bản và hình ảnh. Nó có thể giúp các nhà phát triển xây dựng “tìm kiếm ngữ nghĩa và phân loại văn bản mạnh mẽ”.
Công ty cho biết: “Phần nhúng chuyển đổi dữ liệu văn bản và hình ảnh thành các vectơ số ánh xạ cho quan hệ ngữ nghĩa đa chiều và có thể được xử lý bằng các mô hình lớn và đặc biệt hữu ích cho các đầu vào dài hơn, chẳng hạn như văn bản có hàng nghìn mã thông báo”.
API nhúng hiện có sẵn cho các các nhà phát triển trong Vertex AI, với phiên bản ở dạng thử nghiệm chỉ dành cho những người kiểm tra đáng tin cậy sử dụng API văn bản/hình ảnh.
(Theo Shanklin)
Xem thêm bài viết:
Bạn có biết: 8 tính năng Bard AI của Google có nhưng ChatGPT thì không?
Google sẽ cách mạng hóa dịch vụ tìm kiếm với trí tuệ nhân tạo PaLM 2