Mặc dù đã đạt được những bước tiến đáng kể kể từ khi ra mắt ban đầu, DALL-E vẫn còn lâu mới đạt đến sự hoàn hảo. Công cụ tạo hình ảnh từ AI này tồn tại nhiều vấn đề cần được khắc phục, và nhiều trong số đó trở nên rõ ràng hơn khi người dùng sử dụng thường xuyên. Sự thiếu nhất quán và kích thước không chính xác chỉ là một vài ví dụ điển hình trong số đó.
1. Vẫn Gặp Khó Khăn Với Văn Bản
Mặc dù các công cụ AI nói chung vẫn chưa thể viết văn bản trong hình ảnh một cách hiệu quả, nhưng theo kinh nghiệm cá nhân sau khi thử nghiệm hàng tá trình tạo nghệ thuật AI, DALL-E vẫn là một trong những công cụ tệ nhất về mặt này. Bạn có thể thành công hơn với các yêu cầu đơn giản, nhưng như minh họa dưới đây, phần mềm vẫn gặp khó khăn trong việc viết dấu trên từ “Café”.
DALL-E tạo ảnh quán cà phê với chữ "Café" bị lỗi dấu tiếng Việt
Trong nhiều thử nghiệm, DALL-E cũng thường xuyên viết sai chính tả văn bản của tôi, mặc dù tôi đã đưa ra các prompt rất rõ ràng và thử nhiều lần để khắc phục vấn đề này. Trong các trường hợp khác, văn bản bị biến dạng hoặc không thể đọc được. Bạn cũng sẽ nhận thấy rằng DALL-E không tạo ra văn bản rõ ràng cho các biển báo đường phố và các vật thể tương tự.
2. Không Thay Đổi Kích Thước Ảnh Khi Được Yêu Cầu
DALL-E hiểu khá tốt nhu cầu tạo ra một hình ảnh, nhưng lại khá kém trong việc thay đổi kích thước chúng khi được yêu cầu. Ví dụ, tôi đã yêu cầu phần mềm thay đổi kích thước hình ảnh nhiều lần cho các bài blog khác nhau; mỗi lần, DALL-E chỉ đơn giản là tạo lại một bức ảnh mới thay vì điều chỉnh kích thước bức ảnh hiện có.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh là khá đơn giản. Nhiều công cụ miễn phí, như Canva, cho phép bạn thực hiện điều này dễ dàng. Tuy nhiên, sẽ tốt hơn nếu có thể làm được điều đó mà không cần dựa vào phần mềm của bên thứ ba.
3. Thất Bại Khi Tạo Ảnh Chân Thực
DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng theo tôi, nó khá tệ trong việc tạo ra những hình ảnh chân thực (photorealistic). Ví dụ, tôi đã yêu cầu AI tạo một hình ảnh về một chú chó Golden Retriever trong núi dưới đây (mà không nói rõ loại hình ảnh mà nó nên là).
Ảnh chú chó Golden Retriever trong núi được tạo bởi DALL-E, trông thiếu chân thực
Mặc dù trông cũng ổn, nhưng vẫn dễ dàng nhận ra đây là một bức ảnh được tạo bởi AI. Vì vậy, tôi đã yêu cầu DALL-E làm cho nó chân thực hơn. Ngược lại, hình ảnh trông càng giả hơn (và thành thật mà nói, hơi đáng sợ).
DALL-E thất bại khi cố gắng tạo ảnh chân thực của chú chó, ảnh trông giả tạo và đáng sợ
Việc sử dụng Photorealistic Custom GPT có thể giúp ích, nhưng bạn cần có gói đăng ký cao cấp để truy cập tính năng này. Nếu không, bạn có thể tham khảo nhiều trình tạo nghệ thuật AI khác chuyên tạo ảnh chân thực, ví dụ như Adobe Firefly là một gợi ý hàng đầu.
4. Phần Mềm Không “Lắng Nghe” Khi Yêu Cầu Không Làm Gì Đó
Một cách để viết prompt hiệu quả hơn trong Midjourney, ChatGPT và các công cụ AI khác là nói rõ những gì bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, làm như vậy sẽ mang lại kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều dịp, tôi đã yêu cầu DALL-E không đưa các yếu tố nhất định vào bức ảnh của mình. Thế nhưng, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể khắc phục được, nhưng sẽ tốt hơn nếu không phải lặp lại thao tác này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Sự Không Nhất Quán Trong Một Số Lĩnh Vực Cụ Thể
Nhiều trình tạo nghệ thuật AI đều có những điểm yếu; ví dụ, khi tôi thử nghiệm Photo AI, nó đặc biệt tệ trong việc tạo ra bàn tay. DALL-E cũng mắc lỗi về sự không nhất quán trong nhiều lĩnh vực khác nhau.
Mặc dù DALL-E rất giỏi trong việc tạo ra các hình ảnh chung chung, nhưng nó không phải lúc nào cũng tốt trong việc tạo ra hình ảnh người đang cầm vật thể. Điều kỳ lạ là phần mềm cũng kém trong việc tạo ra màn hình máy tính. Thường xuyên hơn là không, nó cho ra một cụm hình dạng ngẫu nhiên. Việc yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp ích.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có thể tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo nghệ thuật AI trông giống như tranh vẽ, và cũng có thể tạo ra hình ảnh trông có tính 3D hơn. Tuy nhiên, sự đa dạng trong việc tạo hình ảnh này đôi khi có thể dẫn đến các phong cách không nhất quán.
Khi yêu cầu DALL-E tạo một hình ảnh, bạn phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Đây không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại là vấn đề nếu bạn muốn có một phong cách nhất quán trên toàn bộ các sản phẩm của mình.
7. Kích Thước Vật Thể Không Tỷ Lệ
Việc làm cho các vật thể trong hình ảnh của bạn trông cân đối với kích thước thực tế là rất quan trọng nếu bạn quan tâm đến độ chính xác của ảnh. Thật không may, DALL-E đôi khi không làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người cầm điện thoại trong tay, chiếc điện thoại đôi khi sẽ quá lớn.
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm làm cho hình ảnh có góc rộng hơn sẽ giải quyết được vấn đề. Tuy nhiên, điều này thực sự còn làm mọi thứ tệ hơn. Hơn nữa, người đó trông cũng giả tạo. Việc thử các prompt chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra cách khắc phục cho vấn đề này.
Ảnh một người cầm điện thoại được tạo bởi DALL-E với kích thước điện thoại bị sai tỷ lệ
8. DALL-E Gặp Khó Khi Tạo Vật Liệu Bên Ngoài (Thiết Kế In Ấn)
Ban đầu, tôi nghĩ DALL-E sẽ là một cách tuyệt vời để tạo lịch cá nhân, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng phát hiện ra rằng phần mềm này không làm tốt trong lĩnh vực này.
Ví dụ, tôi đã thử làm bìa thiệp sinh nhật bằng DALL-E trong quá khứ. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải nó lên một dịch vụ như Moonpig sau này. Thật không may, tôi liên tục nhận được một thiết kế bao gồm một chiếc thiệp sinh nhật ngay bên trong bức ảnh.
Lỗi DALL-E khi tạo bìa thiệp sinh nhật, hình ảnh chứa cả thiệp thay vì chỉ thiết kế nền
Nếu bạn thực sự muốn sử dụng DALL-E cho những loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên một tấm thiệp sinh nhật. Thay vào đó, hãy chỉ định chính xác những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước hoặc thêm văn bản bằng một ứng dụng khác.
9. Ảnh Chất Lượng Thấp Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI cụ thể mà mình muốn sử dụng. Trong những trường hợp này, việc nhờ các công cụ tạo ảnh và yêu cầu chúng tạo ra nhiều biến thể hình ảnh có thể có lý. Nhưng theo kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp cho tôi nhiều tùy chọn.
Trong nhiều trường hợp, những bức ảnh tôi nhận được thường trông rất giống nhau. Kết quả là, bạn phải thật cụ thể trong prompt của mình. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một sau khi đã thử nghiệm đã hiệu quả hơn là yêu cầu nhiều biến thể cùng một lúc.
Mặc dù tôi rất thích sử dụng DALL-E nói chung, nhưng phần mềm này không hoàn hảo và bạn chắc chắn sẽ gặp phải các vấn đề. Ví dụ, nó kém trong việc tạo ra hình ảnh chân thực nếu không sử dụng Custom GPTs. Hơn nữa, phần mềm thường không loại trừ các yếu tố mà tôi không muốn có trong bức ảnh. Tuy nhiên, tôi vẫn khuyến khích bạn thử DALL-E; hãy tự mình trải nghiệm để xem liệu những vấn đề này có xuất hiện với bạn hay không. Hãy chia sẻ trải nghiệm và ý kiến của bạn về các hạn chế của DALL-E trong phần bình luận bên dưới nhé!