Google Imagen 3, một trong những mô hình AI chuyển văn bản thành hình ảnh mạnh mẽ nhất, đã có mặt trên các ứng dụng Gemini, nhưng với một số giới hạn nhất định. Cụ thể, khả năng tạo ra hình ảnh con người trước đây chỉ dành cho người dùng trả phí – cho đến tận bây giờ.
Gemini Miễn Phí Giờ Đây Đã Có Thể Tạo Ảnh Người
Nếu bạn đã từng sử dụng ứng dụng web, máy tính để bàn hoặc di động của Gemini, chắc hẳn bạn đã trải nghiệm tính năng tạo hình ảnh do mô hình Google Imagen 3 hỗ trợ. Google đã chính thức phát hành công cụ này cho tất cả người dùng vào tháng 8 năm 2024, với nhiều tùy chọn từ “phong cảnh siêu thực” đến “cảnh đất sét sống động đầy ngẫu hứng”, theo thông báo trên blog The Keyword của Google.
Tuy nhiên, việc tạo hình ảnh con người lại là một câu chuyện khác. Google đã giới hạn tính năng cụ thể này cho các thuê bao trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sở hữu tài khoản miễn phí và yêu cầu Gemini tạo ra một hình ảnh có người, bạn sẽ nhận được thông báo: “Tính năng tạo hình ảnh người chỉ khả dụng ở chế độ truy cập sớm với Gemini Advanced.”
Hiện tại, kể từ tháng 2 năm 2025, hầu hết người dùng Gemini miễn phí đã có thể tạo thành công các hình ảnh có liên quan đến con người trên Gemini. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này vẫn đang trong quá trình triển khai dần. Dường như Google đang bắt đầu với người dùng ở Hoa Kỳ và sử dụng Gemini với ngôn ngữ tiếng Anh.
Giao diện người dùng Gemini yêu cầu tạo ảnh một người phụ nữ đang ăn kem, minh họa tính năng tạo ảnh người bằng AI.
Theo hướng dẫn của Gemini, bạn vẫn không thể tạo ra hình ảnh chân thực về những người hoặc trẻ em có thể nhận dạng được.
Hiệu Suất Của Imagen 3 Trên Gemini Flash 2.0 Ra Sao?
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình cho người dùng miễn phí. Google mô tả mô hình này, có tên Gemini 2.0 Flash, là một “cỗ máy làm việc hiệu quả cao”, điều này chỉ có thể mang lại những điều tốt đẹp cho khả năng tạo hình ảnh. So với việc tạo văn bản tiêu chuẩn, hình ảnh AI thường tiêu tốn nhiều năng lượng và thời gian hơn, nên về lý thuyết, chúng có thể đạt được chất lượng cao hơn khi được hỗ trợ bởi một mô hình mạnh mẽ hơn.
Chất lượng dường như đặc biệt quan trọng khi nói đến việc tạo hình ảnh con người. Chúng ta đều từng chứng kiến những hình ảnh AI về người ban đầu với bàn tay biến dạng, thừa ngón hay đôi mắt trống rỗng. Vì vậy, bạn có thể hiểu được sự do dự của tôi khi tin tưởng vào công cụ tạo hình ảnh AI của Google với tư cách là một người dùng miễn phí.
Tổng hợp các hình ảnh AI được tạo bởi Gemini, cho thấy khả năng đa dạng của mô hình Imagen 3.
Một ví dụ về ảnh AI do Gemini tạo ra, mô tả người phụ nữ đang ăn kem, thể hiện chất lượng hình ảnh người trên Gemini.
Trái ngược với lo ngại của tôi, tôi thực sự ấn tượng bởi khả năng của Gemini trong việc xử lý các yêu cầu tạo hình ảnh có người. Đặc biệt khi xét đến việc dịch vụ này là miễn phí, tôi thấy những hình ảnh thử nghiệm đầu tiên có chất lượng cao cấp, chân thực và phù hợp với yêu cầu đã cung cấp. Bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa một hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần.
Việc có thể truy cập Imagen 3 qua Gemini miễn phí chắc chắn là một trải nghiệm thú vị, nhưng việc phải tránh tạo hình ảnh con người là một hạn chế đáng kể. Bản cập nhật mới nhất của Google đã mở rộng đáng kể sân chơi, giúp dịch vụ miễn phí của Gemini trở thành một đối thủ cạnh tranh đáng gờm với các dịch vụ trả phí như Midjourney. Mặc dù các dịch vụ trả phí sẽ có nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, cách tiếp cận của Gemini rất dễ sử dụng và sẵn sàng hoạt động. Với rất nhiều thứ có sẵn miễn phí, tôi tự hỏi liệu quyền truy cập sớm có còn đủ để mọi người trả tiền cho Gemini Advanced nữa không.