Andy Nguyễn
Guest
(Tổ Quốc) - Tính đến thời điểm hiện tại, các ví dụ về phần mềm chỉnh ảnh bằng AI này hiện chỉ có sẵn thông qua các bản demo trực tuyến, nhưng nó cho thấy trí tuệ nhân tạo tiềm năng đến mức nào khi hỗ trợ người dùng trong việc tạo ra một hình ảnh theo mong muốn.
Một nhóm các nhà nghiên cứu từ các công ty và tổ chức tên tuổi lớn như Google, MIT và Đại học Pennsylvania đã hé lộ một ứng dụng chỉnh sửa ảnh mới tận dụng AI theo một cách rất sáng tạo mang tên DragGAN.
Đúng như tên gọi (Drag - Tạm dịch: Kéo thả), công cụ đang được phát triển này cho phép người dùng thao tác với một hình ảnh bằng cách kéo hai thành phần chính bất kỳ trong ảnh để thực hiện các chỉnh sửa. Điều này mang tới sự tự do đáng kể trong việc chỉnh ảnh, cho phép người dùng thay đổi các yếu tố như hướng, góc, cạnh khi đối tượng trong ảnh như thể đã được '3D hóa'.
Về cơ bản, DragGAN tương tự như công cụ Photoshop Warp của Adobe, nhưng có khả năng thay đổi, chỉnh sửa hình ảnh ở cấp độ cao hơn. Thay vì chỉ đơn giản là có thể kéo giãn pixel theo một cách vui nhộn và sáng tạo, công cụ AI mới này có thể tái tạo các vùng của hình ảnh vốn thậm chí không tồn tại trước đó mà không không làm cong hình ảnh gốc.
Nói cách khác, AI sẽ xử lý bất kỳ 'lỗ hổng' nào có thể phát sinh (khi vị trí của vật thể trong hình di chuyển) bằng cách tạo ra tạo ra các pixel mới dựa trên ngữ cảnh và vị trí của các điểm lấy, bảo toàn tính hiện thực của ảnh - điều mà không nhiều phần mềm chỉnh sửa ảnh như Photoshop có thể làm được.
Tính đến thời điểm hiện tại, các ví dụ về phần mềm chỉnh ảnh bằng Photoshop này hiện chỉ có sẵn thông qua các bản demo trực tuyến, nhưng nó cho thấy trí tuệ nhân tạo tiềm năng đến mức nào khi hỗ trợ người dùng trong việc tạo ra một hình ảnh theo mong muốn.
Chẳng hạn, bạn có thể thay đổi biểu cảm trên khuôn mặt của một người, hoặc chỉnh sửa khuôn mặt đang 'trầm ngâm' trở thành một khuôn mặt đang cất lên tiếng gầm dữ dội. Tương tự, người dùng có thể biến một khuôn mặt gắt gỏng của một người trong ảnh thành một khuôn mặt đang nở nụ cười tươi rói và hạnh phúc, hoặc đơn giản là thay đổi vị trí của chú chó của bạn sang chỗ mình mong muốn.
Trong thời gian gần đây, Photoshop đã giới thiệu một số công cụ dựa trên trí tuệ nhân tạo, chẳng hạn như bộ lọc thần kinh cho phép bạn điều chỉnh biểu cảm của chân dung bằng thanh trượt. Tuy nhiên, DragGAN lại sở hữu một điểm hút khách khác là giao diện đơn giản và đầy trực quan. Chỉ trong vài giây, người dùng có thể nắm bắt chức năng chính của công cụ mà không cần phải đọc tài liệu hướng dẫn.
Giao diện của DragGAN đơn giản, trực quan và tương đối dễ sử dụng với hầu hết người dùng. Ảnh: DragGAN
Cụ thể, tất cả những gì người dùng cần làm là thêm điểm bắt đầu và điểm kết thúc vào hình ảnh bằng vài cú click chuột. Ví dụ, để tạo nụ cười trên khuôn mặt một người, người dùng có thể thêm hai điểm ở khóe miệng và thêm hai điểm ở xa hơn một chút. Nhấn nút Bắt đầu và công cụ sẽ mở rộng miệng một cách sinh động từ điểm bắt đầu đến điểm kết thúc.
DragGAN cũng cung cấp tính năng 'tạo mặt nạ', cho phép người dùng đánh dấu các phần cụ thể của hình ảnh mà họ muốn thay đổi trong khi không chạm vào phần còn lại.
Cuối cùng, DragGAN có thể giúp giải quyết nhược điểm lớn nhất của các công cụ tạo hình ảnh bằng AI nổi bật như MidJourney – bản chất ngẫu nhiên của chúng. Nếu DragGAN được ghép nối với các công cụ tạo hình ảnh bằng AI, người dùng sẽ có thể đạt được kết quả đầu ra gần với hình ảnh mà họ nghĩ đến. Công cụ này hiện chỉ là một bản demo, nhưng các ứng dụng của nó sẽ rất thú vị khi ra mắt rộng rãi trong tương lai gần.
Một nhóm các nhà nghiên cứu từ các công ty và tổ chức tên tuổi lớn như Google, MIT và Đại học Pennsylvania đã hé lộ một ứng dụng chỉnh sửa ảnh mới tận dụng AI theo một cách rất sáng tạo mang tên DragGAN.
Đúng như tên gọi (Drag - Tạm dịch: Kéo thả), công cụ đang được phát triển này cho phép người dùng thao tác với một hình ảnh bằng cách kéo hai thành phần chính bất kỳ trong ảnh để thực hiện các chỉnh sửa. Điều này mang tới sự tự do đáng kể trong việc chỉnh ảnh, cho phép người dùng thay đổi các yếu tố như hướng, góc, cạnh khi đối tượng trong ảnh như thể đã được '3D hóa'.
Về cơ bản, DragGAN tương tự như công cụ Photoshop Warp của Adobe, nhưng có khả năng thay đổi, chỉnh sửa hình ảnh ở cấp độ cao hơn. Thay vì chỉ đơn giản là có thể kéo giãn pixel theo một cách vui nhộn và sáng tạo, công cụ AI mới này có thể tái tạo các vùng của hình ảnh vốn thậm chí không tồn tại trước đó mà không không làm cong hình ảnh gốc.
Nói cách khác, AI sẽ xử lý bất kỳ 'lỗ hổng' nào có thể phát sinh (khi vị trí của vật thể trong hình di chuyển) bằng cách tạo ra tạo ra các pixel mới dựa trên ngữ cảnh và vị trí của các điểm lấy, bảo toàn tính hiện thực của ảnh - điều mà không nhiều phần mềm chỉnh sửa ảnh như Photoshop có thể làm được.
Tính đến thời điểm hiện tại, các ví dụ về phần mềm chỉnh ảnh bằng Photoshop này hiện chỉ có sẵn thông qua các bản demo trực tuyến, nhưng nó cho thấy trí tuệ nhân tạo tiềm năng đến mức nào khi hỗ trợ người dùng trong việc tạo ra một hình ảnh theo mong muốn.
Chẳng hạn, bạn có thể thay đổi biểu cảm trên khuôn mặt của một người, hoặc chỉnh sửa khuôn mặt đang 'trầm ngâm' trở thành một khuôn mặt đang cất lên tiếng gầm dữ dội. Tương tự, người dùng có thể biến một khuôn mặt gắt gỏng của một người trong ảnh thành một khuôn mặt đang nở nụ cười tươi rói và hạnh phúc, hoặc đơn giản là thay đổi vị trí của chú chó của bạn sang chỗ mình mong muốn.
Trong thời gian gần đây, Photoshop đã giới thiệu một số công cụ dựa trên trí tuệ nhân tạo, chẳng hạn như bộ lọc thần kinh cho phép bạn điều chỉnh biểu cảm của chân dung bằng thanh trượt. Tuy nhiên, DragGAN lại sở hữu một điểm hút khách khác là giao diện đơn giản và đầy trực quan. Chỉ trong vài giây, người dùng có thể nắm bắt chức năng chính của công cụ mà không cần phải đọc tài liệu hướng dẫn.
Giao diện của DragGAN đơn giản, trực quan và tương đối dễ sử dụng với hầu hết người dùng. Ảnh: DragGAN
Cụ thể, tất cả những gì người dùng cần làm là thêm điểm bắt đầu và điểm kết thúc vào hình ảnh bằng vài cú click chuột. Ví dụ, để tạo nụ cười trên khuôn mặt một người, người dùng có thể thêm hai điểm ở khóe miệng và thêm hai điểm ở xa hơn một chút. Nhấn nút Bắt đầu và công cụ sẽ mở rộng miệng một cách sinh động từ điểm bắt đầu đến điểm kết thúc.
DragGAN cũng cung cấp tính năng 'tạo mặt nạ', cho phép người dùng đánh dấu các phần cụ thể của hình ảnh mà họ muốn thay đổi trong khi không chạm vào phần còn lại.
Cuối cùng, DragGAN có thể giúp giải quyết nhược điểm lớn nhất của các công cụ tạo hình ảnh bằng AI nổi bật như MidJourney – bản chất ngẫu nhiên của chúng. Nếu DragGAN được ghép nối với các công cụ tạo hình ảnh bằng AI, người dùng sẽ có thể đạt được kết quả đầu ra gần với hình ảnh mà họ nghĩ đến. Công cụ này hiện chỉ là một bản demo, nhưng các ứng dụng của nó sẽ rất thú vị khi ra mắt rộng rãi trong tương lai gần.