Mặc dù đã có những bước tiến đáng kể kể từ khi ra mắt ban đầu, DALL-E vẫn chưa hoàn hảo. Trình tạo ảnh AI này có nhiều vấn đề cần khắc phục, và nhiều trong số đó trở nên rõ ràng hơn khi bạn sử dụng nó thường xuyên. Từ sự thiếu nhất quán cho đến việc không thể thay đổi kích thước chính xác, những hạn chế này có thể ảnh hưởng đến trải nghiệm của người dùng và chất lượng hình ảnh cuối cùng. Dù DALL-E vẫn là một công cụ mạnh mẽ, việc hiểu rõ các điểm yếu của nó sẽ giúp bạn sử dụng hiệu quả hơn và biết khi nào cần tìm giải pháp thay thế.
1. Gặp Khó Khăn Với Việc Tạo Văn Bản Chính Xác
Trong số các trình tạo ảnh AI, DALL-E vẫn là một trong những công cụ gặp nhiều khó khăn nhất khi tạo văn bản trong hình ảnh. Mặc dù bạn có thể thành công hơn với các yêu cầu đơn giản, nhưng phần mềm vẫn thường xuyên gặp vấn đề, chẳng hạn như không thể viết đúng dấu phụ hoặc tạo ra các ký tự biến dạng.
Trong nhiều thử nghiệm, DALL-E còn đánh vần sai văn bản dù tôi đã đưa ra các câu lệnh (prompt) rất rõ ràng và cố gắng sửa lỗi nhiều lần. Trong các trường hợp khác, văn bản bị méo mó, khó đọc. Bạn cũng sẽ nhận thấy rằng DALL-E không thể tạo văn bản dễ đọc cho biển báo đường phố và các đối tượng tương tự.
DALL-E gặp lỗi khi tạo văn bản tiếng Việt trên ảnh quán cà phê
2. Không Thay Đổi Kích Thước Hình Ảnh Theo Yêu Cầu
DALL-E hiểu khá tốt nhu cầu tạo ra một hình ảnh, nhưng lại rất tệ trong việc thay đổi kích thước chúng khi được yêu cầu. Ví dụ, tôi đã nhiều lần yêu cầu phần mềm thay đổi kích thước hình ảnh cho các mục đích khác nhau, nhưng mỗi lần DALL-E chỉ đơn thuần tạo lại một bức ảnh mới thay vì điều chỉnh kích thước bức ảnh hiện có.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh khá đơn giản với các công cụ bên ngoài. Nhiều công cụ miễn phí như Canva cho phép bạn thực hiện điều này một cách dễ dàng. Tuy nhiên, sẽ rất tiện lợi nếu có thể thực hiện trực tiếp trong DALL-E mà không cần phải dựa vào phần mềm của bên thứ ba.
3. Khó Tạo Ra Hình Ảnh Siêu Thực (Photorealistic)
DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng tôi nghĩ rằng nó khá kém trong việc tạo ra hình ảnh siêu thực (photorealistic). Ví dụ, tôi đã yêu cầu AI tạo ra hình ảnh một chú chó golden retriever trên núi mà không chỉ định phong cách.
Hình ảnh chó golden retriever trên núi do DALL-E tạo ra
Mặc dù trông khá ổn, nhưng vẫn dễ dàng nhận ra đây là một bức ảnh được tạo bởi AI. Vì vậy, tôi đã yêu cầu DALL-E làm cho nó trở nên siêu thực hơn. Ngược lại, hình ảnh lại trông giả hơn đáng kể (và hơi đáng sợ).
Thử tạo ảnh siêu thực chó golden retriever bằng DALL-E thất bại
Việc sử dụng Photorealistic Custom GPT có thể giúp ích, nhưng bạn cần có gói đăng ký cao cấp để truy cập tính năng này. Nếu không, có nhiều trình tạo ảnh AI khác tạo ra hình ảnh siêu thực tốt hơn, trong đó Adobe Firefly là một gợi ý hàng đầu.
4. Không “Lắng Nghe” Lệnh Phủ Định Từ Người Dùng
Một cách để viết câu lệnh tốt hơn trong Midjourney, ChatGPT và các công cụ AI khác là nói rõ điều bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, làm như vậy sẽ cho kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều trường hợp, tôi đã yêu cầu DALL-E không bao gồm một số yếu tố nhất định trong hình ảnh của mình. Thế nhưng, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể khắc phục được, nhưng sẽ tốt hơn nếu không phải lặp lại bước này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Sự Không Nhất Quán Trong Một Số Khu Vực
Nhiều trình tạo ảnh AI đều có những điểm yếu riêng. Ví dụ, Photo AI đặc biệt kém trong việc tạo bàn tay. DALL-E cũng mắc lỗi về sự không nhất quán ở nhiều khía cạnh khác nhau.
Mặc dù DALL-E rất tốt trong việc tạo ra hình ảnh tổng thể, nhưng nó không phải lúc nào cũng giỏi trong việc tạo ra hình ảnh con người đang cầm vật thể. Lạ lùng hơn, phần mềm này cũng kém trong việc tạo ra màn hình máy tính; thường thì nó chỉ cho ra một mớ hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải lúc nào cũng) có thể giúp ích.
6. Phong Cách Hình Ảnh Thiếu Nhất Quán
DALL-E có thể tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo ảnh AI trông giống như tranh vẽ, và cũng có thể tạo hình ảnh trông giống 3D hơn. Tuy nhiên, sự đa dạng này đôi khi dẫn đến các phong cách hình ảnh không nhất quán.
Khi yêu cầu DALL-E tạo hình ảnh, bạn phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Đây không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại là một nhược điểm lớn nếu bạn muốn duy trì một phong cách nhất quán cho tất cả các hình ảnh của mình.
7. Kích Thước Vật Thể (Artifact) Không Chính Xác
Việc các đối tượng trong hình ảnh trông cân xứng với kích thước thực tế của chúng là rất quan trọng nếu bạn quan tâm đến độ chính xác của ảnh. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trong tay, chiếc điện thoại đôi khi sẽ quá lớn.
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm tạo ảnh góc rộng hơn sẽ giải quyết vấn đề. Tuy nhiên, điều này thực sự làm mọi thứ tệ hơn, và người trong ảnh trông giả hơn. Việc thử các câu lệnh chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra cách khắc phục cho vấn đề này.
Người cầm điện thoại được tạo bởi DALL-E với kích thước không cân xứng
8. Gặp Khó Khi Tạo Các Tài Liệu Bên Ngoài
Ban đầu, tôi nghĩ DALL-E sẽ là một cách tuyệt vời để tạo lịch cá nhân hóa, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng phát hiện ra rằng phần mềm này không làm tốt trong lĩnh vực này.
Ví dụ, tôi đã từng thử làm bìa thiệp sinh nhật với DALL-E. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải nó lên một dịch vụ như Moonpig. Thật không may, tôi liên tục nhận được một thiết kế bao gồm một chiếc thiệp sinh nhật ngay trong bức ảnh.
Lỗi DALL-E khi tạo thiệp sinh nhật với văn bản và thiết kế không đúng
Nếu bạn thực sự muốn sử dụng DALL-E cho các loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên thiệp sinh nhật. Thay vào đó, hãy chỉ định rõ bạn muốn chương trình tạo ra cái gì. Sau đó, bạn có thể điều chỉnh kích thước bằng các ứng dụng khác. Tốt nhất là chỉ tạo hình ảnh trong DALL-E và thêm văn bản sau bằng một ứng dụng khác.
9. Hình Ảnh Chất Lượng Thấp Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI cụ thể nào mình muốn sử dụng. Trong những trường hợp này, việc nhờ các trình tạo ảnh tạo ra nhiều biến thể hình ảnh có thể hữu ích. Nhưng theo kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi đưa ra nhiều tùy chọn.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau. Kết quả là, bạn phải rất cụ thể trong yêu cầu của mình. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một hoạt động hiệu quả hơn là yêu cầu nhiều biến thể cùng lúc.
Mặc dù tôi rất thích sử dụng DALL-E nói chung, nhưng phần mềm này không hoàn hảo và bạn sẽ gặp phải các vấn đề đã nêu. Chẳng hạn, nó kém trong việc tạo ra hình ảnh siêu thực nếu không sử dụng Custom GPT. Hơn nữa, phần mềm thường không loại trừ các yếu tố mà tôi không muốn có trong ảnh. Dù vậy, tôi vẫn khuyên bạn nên thử DALL-E; hãy tự mình trải nghiệm để xem liệu những vấn đề này có xảy ra với bạn hay không.
Bạn có gặp phải những vấn đề tương tự khi sử dụng DALL-E không? Hãy chia sẻ kinh nghiệm và các mẹo khắc phục của bạn trong phần bình luận bên dưới!