Thanh Thúy
Well-known member
Vài tháng trước, Google đã giới thiệu Nano Banana (Gemini 2.5 Flash Image), công cụ giúp người dùng chỉnh sửa ảnh cơ bản hoặc tạo các hình ảnh vui nhộn. Tiếp nối đà phát triển đó, Google DeepMind chính thức công bố Nano Banana Pro (Gemini 3 Pro Image). Đây là phiên bản nâng cấp dựa trên nền tảng Gemini 3 Pro, tập trung vào việc khắc phục các hạn chế thường gặp của AI tạo ảnh hiện nay như lỗi chính tả khi viết chữ hay sự sai lệch về chi tiết thực tế.
Tạo biểu đồ và hình ảnh từ dữ liệu thực tế
Một hạn chế lớn của nhiều công cụ vẽ AI là thiếu kiến thức thực tế, thường tạo ra các hình ảnh đẹp nhưng thông tin bên trong lại vô nghĩa. Nano Banana Pro khắc phục điều này bằng cách tận dụng khả năng tư duy của Gemini 3 và kết nối với dữ liệu từ Google Search.
Thay vì chỉ vẽ tranh nghệ thuật, công cụ này có thể tạo ra các nội dung mang tính thông tin chính xác hơn. Ví dụ, người dùng có thể yêu cầu AI tạo một bảng hướng dẫn nấu ăn, biểu đồ thời tiết hoặc sơ đồ về các loài cây dựa trên dữ liệu thật.
Hiển thị văn bản rõ ràng và hỗ trợ đa ngôn ngữ
Trước đây, việc yêu cầu AI chèn chữ vào ảnh thường cho kết quả không tốt (chữ bị méo, sai chính tả). Nano Banana Pro đã cải thiện đáng kể khả năng hiển thị văn bản. Công cụ này có thể xử lý từ các khẩu hiệu ngắn đến các đoạn văn bản dài trong ảnh với độ sắc nét cao.
Ngoài ra, nhờ khả năng hiểu ngôn ngữ, AI này hỗ trợ tốt việc thay đổi ngôn ngữ trên thiết kế. Ví dụ, bạn có thể yêu cầu dịch các dòng chữ trên một bao bì sản phẩm từ tiếng Anh sang tiếng Hàn, trong khi vẫn giữ nguyên màu sắc và bố cục gốc của hình ảnh.
Giữ độ nhất quán của nhân vật và công cụ chỉnh sửa chi tiết
Đối với người làm thiết kế hoặc sáng tạo nội dung, việc giữ cho nhân vật giống nhau qua nhiều bức ảnh là rất quan trọng. Nano Banana Pro cho phép người dùng kết hợp tối đa 14 hình ảnh đầu vào và duy trì sự nhất quán về ngoại hình cho tối đa 5 nhân vật khác nhau. Tính năng này hữu ích khi cần vẽ truyện tranh, bảng phân cảnh phim hoặc ảnh thời trang.
Bên cạnh đó, Google cung cấp các công cụ chỉnh sửa chi tiết như:
Hiện tại, người dùng có thể trải nghiệm Nano Banana Pro thông qua các cách sau:
Tạo biểu đồ và hình ảnh từ dữ liệu thực tế
Một hạn chế lớn của nhiều công cụ vẽ AI là thiếu kiến thức thực tế, thường tạo ra các hình ảnh đẹp nhưng thông tin bên trong lại vô nghĩa. Nano Banana Pro khắc phục điều này bằng cách tận dụng khả năng tư duy của Gemini 3 và kết nối với dữ liệu từ Google Search.
Thay vì chỉ vẽ tranh nghệ thuật, công cụ này có thể tạo ra các nội dung mang tính thông tin chính xác hơn. Ví dụ, người dùng có thể yêu cầu AI tạo một bảng hướng dẫn nấu ăn, biểu đồ thời tiết hoặc sơ đồ về các loài cây dựa trên dữ liệu thật.
Trước đây, việc yêu cầu AI chèn chữ vào ảnh thường cho kết quả không tốt (chữ bị méo, sai chính tả). Nano Banana Pro đã cải thiện đáng kể khả năng hiển thị văn bản. Công cụ này có thể xử lý từ các khẩu hiệu ngắn đến các đoạn văn bản dài trong ảnh với độ sắc nét cao.
Ngoài ra, nhờ khả năng hiểu ngôn ngữ, AI này hỗ trợ tốt việc thay đổi ngôn ngữ trên thiết kế. Ví dụ, bạn có thể yêu cầu dịch các dòng chữ trên một bao bì sản phẩm từ tiếng Anh sang tiếng Hàn, trong khi vẫn giữ nguyên màu sắc và bố cục gốc của hình ảnh.
Đối với người làm thiết kế hoặc sáng tạo nội dung, việc giữ cho nhân vật giống nhau qua nhiều bức ảnh là rất quan trọng. Nano Banana Pro cho phép người dùng kết hợp tối đa 14 hình ảnh đầu vào và duy trì sự nhất quán về ngoại hình cho tối đa 5 nhân vật khác nhau. Tính năng này hữu ích khi cần vẽ truyện tranh, bảng phân cảnh phim hoặc ảnh thời trang.
Bên cạnh đó, Google cung cấp các công cụ chỉnh sửa chi tiết như:
- Thay đổi ánh sáng: Chuyển cảnh từ ngày sang đêm.
- Chỉnh tiêu điểm: Làm mờ hậu cảnh hoặc lấy nét vào vật thể cụ thể.
- Thay đổi tỷ lệ khung hình: Điều chỉnh kích thước ảnh để phù hợp với các nền tảng mạng xã hội khác nhau mà không làm méo hình nhân vật.
Hiện tại, người dùng có thể trải nghiệm Nano Banana Pro thông qua các cách sau:
- Người dùng phổ thông: Có sẵn trên miễn phí trên ứng dụng Gemini. Người dùng miễn phí sẽ có giới hạn số lần tạo ảnh, trong khi các gói trả phí (Plus, Pro, Ultra) sẽ có hạn mức cao hơn.
- Doanh nghiệp và Lập trình viên: Đã có mặt trên Google Ads, Google Workspace (Slides, Vids) và Vertex AI.