4TechViews

4TechViews
  • Tin tức
  • Sự kiện tech
  • Giải pháp công nghệ
  • Kinh doanh số
  • Hướng dẫn – Thủ thuật
  • Phát triển nghề nghiệp
    • Khóa học IT
      • Trí tuệ nhân tạo
      • Phân tích dữ liệu
      • Khác
    • Khóa học khác
    • Cẩm nang công việc
    • Việc làm – Tuyển dụng
    • Sách hay
  • Diễn đàn
  • Xem thêm
    • Khám phá
    • Đổi mới sáng tạo
    • Sản phẩm xu hướng
    • Mẹo hay cuộc sống
    • Chia sẻ kiến thức
    • Quote hay học tập
    • Bài viết đề cử
    • Góc giải trí
  • Tài khoản
    • Thoát
    • Đăng ký
Home
Giải pháp công nghệ
Nghiên cứu AI mới giúp chỉnh sửa hình ảnh bằng thao tác bấm và kéo thả đơn giản

Nghiên cứu AI mới giúp chỉnh sửa hình ảnh bằng thao tác bấm và kéo thả đơn giản

Tran Hai Giải pháp công nghệ Tin tức 20/05/2023 09/07/2025 4,329

[Hot]   Tìm hiểu về AI & Data Science tại AI4vietnam

[Upcoming]   Tổng hợp các khóa học cho người làm IT

Nghiên cứu AI mới tên DragGAN giúp chỉnh sửa hình ảnh bằng thao tác bấm và kéo thả đơn giản! Công nghệ xử lý hình ảnh bằng AI đã đạt đến giới hạn? Câu trả lời là không nó vẫn chưa kết thúc. Khả năng xử lý hình ảnh của các công cụ AI tiếp tục phát triển.

Ví dụ một nghiên cứu mới ra mắt gần đây cho thấy khả năng xử lý hình ảnh rất ấn tượng. Mô hình cho phép người dùng chỉ cần kéo các phần tử của ảnh để thay đổi diện mạo của chúng. Nó giống như công cụ Warp của Photoshop, nhưng mạnh mẽ hơn nhiều. Bạn không những có thể làm mờ các pixel xung quanh mà còn sử dụng AI để tái tạo lại đối tượng bên dưới.

Điều này nghe có vẻ chưa đủ ấn tượng lắm, nhưng hãy xem các ví dụ bên dưới để biết được những gì hệ thống này có thể làm.

Không chỉ có thể thay đổi kích thước của một chiếc ô tô hoặc biến một nụ cười thành một cái cau mày bằng một cú nhấp và kéo đơn giản, bạn còn có thể xoay đối tượng của ảnh như thể đó là một mô hình 3D — chẳng hạn như thay đổi hướng và góc nhìn của đối tượng. Một bản demo thậm chí còn cho thấy người dùng điều chỉnh hình ảnh phản chiếu trên hồ và độ cao của dãy núi bằng một vài cú nhấp chuột.

Những video này đến từ trang chủ của nhóm nghiên cứu, mặc dù trang này thường xuyên bị lỗi do lượng truy cập quá tải, chủ yếu là bởi người dùng. Tài khoản @_akhaliq, đã rất thành công khi giới thiệu công cụ AI thú vị này. Bạn cũng có thể đọc tài liệu nghiên cứu về arXiv ngay tại đây.

Điều thực sự thú vị về mô hình này không nhất thiết là bản thân thao tác xử lý hình ảnh, mà là giao diện người dùng rất dễ sử dụng và thân thiện.

Hiện tại, chúng ta đã có thể sử dụng các công cụ AI như GAN để tạo ra hình ảnh chân thực, nhưng hầu hết các phương pháp đều thiếu tính linh hoạt và độ chính xác. Bạn hoàn toàn có thể yêu cầu AI tạo ảnh một con sư tử đang rình rập qua thảo nguyên và bạn sẽ nhận được một bức ảnh… nhưng đó có thể không phải là tư thế chính xác mà bạn muốn hoặc cần.

Mô hình AI chỉnh sửa hình ảnh này cung cấp một giải pháp cụ thể cho vấn đề trên. Giao diện hoàn toàn giống với tính năng warp truyền thống. Nhưng thay vì chỉ đơn giản là làm mờ và trộn các pixel hiện có, mô hình sẽ tái tạo đối tượng hình ảnh mới một cách dễ dàng.

DragGAN là mô hình AI xử lý hình ảnh theo một cách thức hoàn toàn mới, trong đó hình ảnh chân thực được người dùng tùy chỉnh thông qua thao tác kéo và thả. Các chi tiết được xử lý bởi một mạng GAN.

Công cụ có thể xử lý các hình ảnh quang học miễn là các biểu diễn phù hợp với các danh mục của bộ dữ liệu đào tạo GAN. Danh mục dữ liệu đào tạo bao gồm động vật, ô tô, con người, tế bào và phong cảnh. Với một giao diện đơn giản, người dùng sau đó kéo các điểm mà họ đã xác định trong hình ảnh đến các vị trí mong muốn, chẳng hạn như để nhắm mắt mèo, xoay đầu hoặc há miệng sư tử và hoặc biến một chiếc ô tô thành một mô hình khác.

Các phương pháp thao tác hình ảnh ngày nay, chẳng hạn như với các công cụ như Photoshop, đòi hỏi nhiều kỹ linh hoạt và khả năng kiểm soát chính xác vị trí, hình dạng, biểu cảm hoặc cách sắp xếp của các đối tượng riêng lẻ. Một tùy chọn khác là tạo các hình ảnh hoàn toàn mới bằng cách sử dụng Generative AI như Stable Diffusion hoặc GANs, những công cụ này ít đòi hỏi sự kiểm soát hơn.

Với DragGAN, các nhà nghiên cứu từ Viện Khoa học Máy tính Max Planck, Trung tâm Nghiên cứu Điện toán Trực quan Saarbrücken, MIT CSAIL và Google đã trình diễn một phương pháp mới trong việc sử dụng GAN để xử lý hình ảnh.

Khi so sánh, DragGAN rõ ràng vượt trội so với các phương pháp khác: “Phương pháp xử lý hình ảnh này có thể hơi ảo, như xử lý các chi tiết bị che khuất như răng bên trong miệng sư tử và có thể biến dạng theo độ cứng của vật thể, như chân ngựa bị uốn cong”, nhóm nghiên cứu cho biết.

Rõ ràng đây chỉ là một bản demo và chưa thể đánh giá công nghệ một cách hoàn chỉnh. Ví dụ: hình ảnh cuối thực tế đến mức nào? Thật khó để đánh giá dựa trên các video có độ phân giải thấp này nhưng đây là một cách tiếp cận khác giúp cho thao tác xử lý hình ảnh ngày càng dễ dàng hơn.

Tải về DragGAN bản Android and PC: Tại đây

Tweet

Bài viết mới

  • Pin muối nóng chảy của Đan Mạch có thể cung cấp điện cho 100.000 hộ gia đình trong 10 giờ: Bước đột phá trong lưu trữ năng lượng quy mô lưới điện.
    Pin muối nóng chảy của Đan Mạch có thể cung cấp điện cho 100.000 hộ gia đình trong 10 giờ
    21/04/2025 0
  • Ứng dụng sức khỏe Apple AI chuẩn bị cho bản nâng cấp lớn với iOS 19.4
    Ứng dụng sức khỏe Apple AI chuẩn bị cho bản nâng cấp lớn với iOS 19.4
    31/03/2025 0
  • Nghiên cứu cho thấy: Một thói quen sử dụng điện thoại thông minh có thể khiến bạn già đi 10 năm
    Nghiên cứu cho thấy: Một thói quen sử dụng điện thoại thông minh có thể khiến bạn già đi 10 năm
    29/03/2025 0
  • Mỹ thử nghiệm robot lấy máu tự động với độ chính xác 95% – Bạn có dám thử?
    Mỹ thử nghiệm robot lấy máu tự động với độ chính xác 95% – Bạn có dám thử?
    28/03/2025 0

Bài viết liên quan

  • Công nghệ Hologram có thể đụng chạm được ra mắt
    Công nghệ Hologram có thể đụng chạm được ra mắt
    26/07/2022 0
  • OpenAI từ chối đề nghị mua lại của Elon Musk, Sam Altman tuyên bố OpenAI không phải để bán
    OpenAI từ chối đề nghị mua lại của Elon Musk, Sam Altman tuyên bố OpenAI không phải để bán
    12/02/2025 0
  • Chip lượng tử ánh sáng rút ngắn 9.000 năm tính toán còn 36 phần triệu giây
    Chip lượng tử ánh sáng rút ngắn 9.000 năm tính toán còn 36 phần triệu giây
    18/07/2022 0
  • Tại sao Web 3.0 là kỷ nguyên mới cho thế hệ tiếp theo?
    Tại sao Web 3.0 là kỷ nguyên mới cho thế hệ tiếp theo?
    29/07/2022 0

Tìm kiếm

Chia sẻ bài viết

DMCA.com Protection Status

Mạng xã hội

  • Facebook
  • Tiktok
  • Youtube
  • Linkedin
  • X-Twitter
  • Reddit
  • Pinterest

Xem nhiều nhất

  • Phân biệt các chức danh Data: Analyst, Scientist, Engineer, ML Engineer
  • Gen AI dẫn đầu xu hướng ứng dụng Trí tuệ nhân tạo trong doanh nghiệp
    Gen AI dẫn đầu xu hướng ứng dụng Trí tuệ nhân tạo trong doanh nghiệp
  • Tổng hợp 1.000+ từ tiếng Anh chuyên ngành Công nghệ thông tin
    Tổng hợp 1.000+ từ tiếng Anh chuyên ngành Công nghệ thông tin
  • Poe AI: Tạo Chatbot tùy chỉnh với sức mạnh của hai nền tảng OpenAI và Claude AI
    Poe AI: Tạo Chatbot tùy chỉnh với sức mạnh của hai nền tảng OpenAI và Claude AI
  • 10 bí quyết giúp việc học của bạn thành một thói quen
    10 bí quyết giúp việc học của bạn thành một thói quen

Facebook fanpage

4TechViews

About Us

Giới thiệu - Liên hệ - Chính sách bảo mật

Liên kết

Đối tác

4TechViews
Copyright © 2025