Nghiên cứu AI mới tên DragGAN giúp chỉnh sửa hình ảnh bằng thao tác bấm và kéo thả đơn giản! Công nghệ xử lý hình ảnh bằng AI đã đạt đến giới hạn? Câu trả lời là không nó vẫn chưa kết thúc. Khả năng xử lý hình ảnh của các công cụ AI tiếp tục phát triển.
Ví dụ một nghiên cứu mới ra mắt gần đây cho thấy khả năng xử lý hình ảnh rất ấn tượng. Mô hình cho phép người dùng chỉ cần kéo các phần tử của ảnh để thay đổi diện mạo của chúng. Nó giống như công cụ Warp của Photoshop, nhưng mạnh mẽ hơn nhiều. Bạn không những có thể làm mờ các pixel xung quanh mà còn sử dụng AI để tái tạo lại đối tượng bên dưới.
Điều này nghe có vẻ chưa đủ ấn tượng lắm, nhưng hãy xem các ví dụ bên dưới để biết được những gì hệ thống này có thể làm.
Không chỉ có thể thay đổi kích thước của một chiếc ô tô hoặc biến một nụ cười thành một cái cau mày bằng một cú nhấp và kéo đơn giản, bạn còn có thể xoay đối tượng của ảnh như thể đó là một mô hình 3D — chẳng hạn như thay đổi hướng và góc nhìn của đối tượng. Một bản demo thậm chí còn cho thấy người dùng điều chỉnh hình ảnh phản chiếu trên hồ và độ cao của dãy núi bằng một vài cú nhấp chuột.
Những video này đến từ trang chủ của nhóm nghiên cứu, mặc dù trang này thường xuyên bị lỗi do lượng truy cập quá tải, chủ yếu là bởi người dùng. Tài khoản @_akhaliq, đã rất thành công khi giới thiệu công cụ AI thú vị này. Bạn cũng có thể đọc tài liệu nghiên cứu về arXiv ngay tại đây.
Điều thực sự thú vị về mô hình này không nhất thiết là bản thân thao tác xử lý hình ảnh, mà là giao diện người dùng rất dễ sử dụng và thân thiện.
Hiện tại, chúng ta đã có thể sử dụng các công cụ AI như GAN để tạo ra hình ảnh chân thực, nhưng hầu hết các phương pháp đều thiếu tính linh hoạt và độ chính xác. Bạn hoàn toàn có thể yêu cầu AI tạo ảnh một con sư tử đang rình rập qua thảo nguyên và bạn sẽ nhận được một bức ảnh… nhưng đó có thể không phải là tư thế chính xác mà bạn muốn hoặc cần.
Mô hình AI chỉnh sửa hình ảnh này cung cấp một giải pháp cụ thể cho vấn đề trên. Giao diện hoàn toàn giống với tính năng warp truyền thống. Nhưng thay vì chỉ đơn giản là làm mờ và trộn các pixel hiện có, mô hình sẽ tái tạo đối tượng hình ảnh mới một cách dễ dàng.
DragGAN là mô hình AI xử lý hình ảnh theo một cách thức hoàn toàn mới, trong đó hình ảnh chân thực được người dùng tùy chỉnh thông qua thao tác kéo và thả. Các chi tiết được xử lý bởi một mạng GAN.
Công cụ có thể xử lý các hình ảnh quang học miễn là các biểu diễn phù hợp với các danh mục của bộ dữ liệu đào tạo GAN. Danh mục dữ liệu đào tạo bao gồm động vật, ô tô, con người, tế bào và phong cảnh. Với một giao diện đơn giản, người dùng sau đó kéo các điểm mà họ đã xác định trong hình ảnh đến các vị trí mong muốn, chẳng hạn như để nhắm mắt mèo, xoay đầu hoặc há miệng sư tử và hoặc biến một chiếc ô tô thành một mô hình khác.
Các phương pháp thao tác hình ảnh ngày nay, chẳng hạn như với các công cụ như Photoshop, đòi hỏi nhiều kỹ linh hoạt và khả năng kiểm soát chính xác vị trí, hình dạng, biểu cảm hoặc cách sắp xếp của các đối tượng riêng lẻ. Một tùy chọn khác là tạo các hình ảnh hoàn toàn mới bằng cách sử dụng Generative AI như Stable Diffusion hoặc GANs, những công cụ này ít đòi hỏi sự kiểm soát hơn.
Với DragGAN, các nhà nghiên cứu từ Viện Khoa học Máy tính Max Planck, Trung tâm Nghiên cứu Điện toán Trực quan Saarbrücken, MIT CSAIL và Google đã trình diễn một phương pháp mới trong việc sử dụng GAN để xử lý hình ảnh.
Khi so sánh, DragGAN rõ ràng vượt trội so với các phương pháp khác: “Phương pháp xử lý hình ảnh này có thể hơi ảo, như xử lý các chi tiết bị che khuất như răng bên trong miệng sư tử và có thể biến dạng theo độ cứng của vật thể, như chân ngựa bị uốn cong”, nhóm nghiên cứu cho biết.
Rõ ràng đây chỉ là một bản demo và chưa thể đánh giá công nghệ một cách hoàn chỉnh. Ví dụ: hình ảnh cuối thực tế đến mức nào? Thật khó để đánh giá dựa trên các video có độ phân giải thấp này nhưng đây là một cách tiếp cận khác giúp cho thao tác xử lý hình ảnh ngày càng dễ dàng hơn.
Tải về DragGAN bản Android and PC: Tại đây
Nghiên cứu AI mới giúp chỉnh sửa hình ảnh bằng thao tác bấm và kéo thả đơn giản
Xem ngay 📹: 👉 Chi tiết: https://4techviews.net/nghien-cuu-ai-moi-giup-chinh-sua-hinh-anh-bang-thao-tac-bam-va-keo-tha/