Với vai trò là một trong những mô hình AI chuyển văn bản thành hình ảnh mạnh mẽ nhất hiện nay, Google Imagen 3 đã có mặt trên các ứng dụng Gemini từ lâu, nhưng khả năng tạo hình ảnh người vẫn là một tính năng độc quyền dành cho người dùng trả phí – cho đến tận bây giờ.
Tính Năng Tạo Ảnh Người Bằng Gemini Hiện Đã Miễn Phí Cho Đa Số Người Dùng
Nếu bạn đã từng sử dụng ứng dụng web, máy tính để bàn hoặc di động của Gemini, chắc hẳn bạn đã trải nghiệm tính năng tạo hình ảnh của nó, được hỗ trợ bởi mô hình Google Imagen 3. Google đã ra mắt công cụ này cho tất cả người dùng vào tháng 8 năm 2024, với nhiều tùy chọn từ “phong cảnh siêu thực” đến “cảnh đất sét vui nhộn”, theo thông báo trên The Keyword của Google.
Tuy nhiên, việc tạo hình ảnh người lại là một câu chuyện khác. Google đã giới hạn việc triển khai tính năng cụ thể này chỉ dành cho những người đăng ký trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sở hữu một tài khoản miễn phí, khi yêu cầu Gemini tạo một hình ảnh có người, bạn sẽ nhận được thông báo: “Tính năng tạo hình ảnh người chỉ có sẵn trong quyền truy cập sớm với Gemini Advanced.”
Giờ đây, kể từ tháng 2 năm 2025, hầu hết người dùng Gemini miễn phí đã có thể tạo thành công các hình ảnh có liên quan đến người. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này đang trong quá trình được triển khai dần dần. Dường như nó đang được phát hành theo từng đợt, bắt đầu từ những người dùng tại Hoa Kỳ sử dụng Gemini với ngôn ngữ tiếng Anh. Bạn vẫn không thể tạo ra các hình ảnh chân thực về người có thể nhận dạng hoặc trẻ em, theo hướng dẫn chính sách của Gemini.
Người dùng tương tác với Gemini để tạo ảnh một phụ nữ đang ăn kem, minh họa tính năng tạo hình ảnh AI.
Đánh Giá Hiệu Suất Của Imagen 3 Trên Mô Hình Gemini Flash 2.0
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình là Gemini 2.0 Flash cho người dùng miễn phí. Google mô tả mô hình này là một “công cụ làm việc hiệu quả cao”, điều này chỉ có thể mang lại những điều tốt đẹp cho việc tạo hình ảnh. Thông thường, việc tạo ảnh AI tiêu tốn nhiều năng lượng và thời gian hơn so với tạo văn bản thông thường, vì vậy hình ảnh AI về mặt lý thuyết có thể đạt được chất lượng cao hơn khi được hỗ trợ bởi một mô hình mạnh mẽ hơn.
Chất lượng đặc biệt quan trọng khi nói đến việc khắc họa hình ảnh con người. Chúng ta đều từng chứng kiến những hình ảnh người do AI tạo ra ở giai đoạn đầu, từ bàn tay bị biến dạng với nhiều ngón thừa cho đến đôi mắt trống rỗng đầy ám ảnh. Do đó, tôi có thể hiểu được sự do dự khi tin tưởng vào công cụ tạo hình ảnh do AI của Google khi là một người dùng miễn phí.
Bộ sưu tập các hình ảnh được tạo bởi AI Gemini, thể hiện khả năng đa dạng của mô hình Imagen 3.
Ngược lại với những lo ngại ban đầu, tôi thực sự ấn tượng với khả năng của Gemini khi xử lý các yêu cầu tạo hình ảnh có chứa người. Đặc biệt khi xem xét dịch vụ này là miễn phí, tôi thấy những lần thử tạo ảnh đầu tiên đều mang lại kết quả cao cấp, chân thực và phù hợp với yêu cầu được cung cấp. Bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa một hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần.
Hình ảnh chân dung một phụ nữ đang ăn kem, được tạo bởi Gemini với chất lượng chân thực, minh họa hiệu suất của Imagen 3.
Việc có thể truy cập Imagen 3 thông qua Gemini miễn phí chắc chắn là một trải nghiệm thú vị, nhưng việc phải tránh tạo hình ảnh người là một hạn chế đáng kể. Bản cập nhật mới nhất của Google đã mở rộng đáng kể sân chơi, giúp dịch vụ miễn phí của Gemini trở thành một đối thủ đáng gờm cho các dịch vụ trả phí như Midjourney. Mặc dù các dịch vụ trả phí sẽ có nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, cách tiếp cận của Gemini lại rất dễ dàng và sẵn sàng để sử dụng. Với rất nhiều tính năng miễn phí có sẵn, thật khó để không tự hỏi liệu quyền truy cập sớm có còn đủ sức hấp dẫn để mọi người chi trả cho Gemini Advanced hay không. Hãy chia sẻ ý kiến của bạn về cập nhật thú vị này dưới phần bình luận nhé!