Các công cụ tạo ảnh AI đã trở thành một phần quen thuộc trong thế giới công nghệ những năm gần đây, từ OpenAI với DALL-E 3 đến Imagen của Google và Adobe Firefly. Khi công nghệ ngày càng tiến bộ, chúng ta có nhiều lựa chọn hơn để tinh chỉnh kết quả đầu ra. Giờ đây, Google Labs vừa ra mắt Whisk, một công cụ độc đáo cho phép người dùng tải lên hình ảnh làm nguồn hướng dẫn thay vì chỉ dựa vào các câu lệnh văn bản (text prompts) truyền thống.
Whisk của Google Labs: Khám Phá Khả Năng Tạo Ảnh Từ Hình Ảnh
Nếu bạn đang ở Hoa Kỳ, bạn có thể tiếp cận Whisk từ Google Labs, một “thử nghiệm trong lĩnh vực AI tạo sinh,” theo thông tin từ blog chính thức của Google. Với Whisk, thay vì chỉ dựa hoàn toàn vào các mô tả văn bản chi tiết, bạn có thể bổ sung hình ảnh làm tài liệu tham khảo. Nền tảng này sẽ yêu cầu bạn cung cấp ba đặc điểm chính: chủ thể, khung cảnh và phong cách. Công cụ sau đó sẽ “trộn” (whisk) các “nguyên liệu” này lại với nhau để tạo ra hình ảnh phù hợp nhất cho bạn. Whisk sử dụng Imagen 3, mô hình tạo ảnh mới nhất của Google.
Google không loại bỏ hoàn toàn các câu lệnh văn bản trong Whisk. Bạn vẫn có tùy chọn viết các prompt tạo hình ảnh cho từng trong ba danh mục kể trên, hoặc thêm một ghi chú chung. Bạn cũng có thể tinh chỉnh hình ảnh sau khi xem kết quả thử nghiệm đầu tiên của Whisk. Chẳng hạn, bạn tạo một tấm thiệp Giáng sinh phong cách cổ điển với hình một chú mèo nằm trong tuyết. Sau khi xem kết quả, bạn có thể muốn thêm những bông tuyết nhỏ để hoàn thiện.
Mỗi khi bạn thêm hoặc tạo một hình ảnh trong bất kỳ ba danh mục nào của Whisk, nền tảng sẽ tự động tạo một mô tả văn bản chi tiết về hình ảnh đó. Do đó, nếu bạn muốn bổ sung hoặc chỉnh sửa một hình ảnh hiện có, bạn chỉ cần tùy chỉnh phần văn bản đã được tạo tự động này.
Whisk tự động tạo mô tả văn bản từ ảnh giúp người dùng dễ dàng chỉnh sửa
Cuối cùng, nếu bạn cảm thấy bí ý tưởng, bạn có thể ngẫu nhiên hóa các thành phần hình ảnh của mình bằng cách chọn biểu tượng con xúc xắc. Đối với các hình ảnh phức tạp hơn, bạn cũng có thể thêm nhiều hơn một tham chiếu cho chủ thể, cảnh hoặc phong cách. Khi bạn hài lòng với “tác phẩm” của mình, bạn có thể lưu nó trên nền tảng hoặc tải xuống để truy cập cục bộ.
Tiềm Năng Thực Sự của Whisk: Một “Whisk” Đáng Thử?
Với vô số tùy chọn tạo ảnh AI tiên tiến hiện có trên thị trường để tăng cường chất lượng ảnh hoặc tạo ra các tác phẩm “nghệ thuật” độc đáo, công cụ mới của Google có thể chỉ được coi là một tính năng phụ. Tuy nhiên, cách Whisk tận dụng các tham chiếu hình ảnh trong quá trình tạo ảnh là hoàn toàn độc đáo và cho thấy giá trị đáng kể trong cả các kịch bản sáng tạo và chuyên nghiệp.
Giả sử bạn đang chuẩn bị một bản thuyết trình và cần những hình ảnh trông tương tự như một mẫu tham khảo bạn đã có. Thay vì cố gắng diễn giải lại mẫu tham khảo đó bằng lời nói, bạn chỉ cần tải tệp đó lên, cùng với một mô tả văn bản ngắn gọn về cách bạn muốn hình ảnh mới khác biệt.
Để phân biệt Whisk với các phần mềm tạo ảnh AI khác, Google đã nhấn mạnh rằng nền tảng này được thiết kế để khám phá ý tưởng – chứ không phải để tinh chỉnh chi tiết. Trong khi các sản phẩm khác có thể phù hợp hơn cho việc chỉnh sửa tỉ mỉ, Whisk lại tối ưu cho quá trình lên ý tưởng:
“Chúng tôi xây dựng nó để khám phá hình ảnh nhanh chóng, không phải chỉnh sửa từng pixel. Đó là về việc khám phá các ý tưởng theo những cách mới mẻ và sáng tạo, cho phép bạn xem qua hàng tá tùy chọn và tải xuống những cái bạn yêu thích.”
Thành thật mà nói, đôi khi thật khó để tìm được từ ngữ phù hợp để diễn tả ý tưởng. Chắc chắn, nhiều người thường gặp khó khăn khi cố gắng tìm ra mô tả chính xác. Đối với tôi, điều này mang lại cho Whisk một tiềm năng nghiêm túc, cho tất cả những lúc mà việc nói “Tôi muốn một hình ảnh trông giống như cái này” đơn giản và hiệu quả hơn rất nhiều. Whisk đại diện cho một bước tiến thú vị trong việc đơn giản hóa quá trình sáng tạo hình ảnh bằng AI, mở ra cánh cửa cho những người dùng không chuyên về prompt text mà vẫn muốn hiện thực hóa ý tưởng của mình.
Hãy chia sẻ ý kiến của bạn về Whisk và liệu bạn có thấy công cụ này hữu ích trong công việc sáng tạo của mình không!