Bản cập nhật mới nhất của ChatGPT từ OpenAI là một trong những cải tiến đáng giá nhất, mang đến một bước tiến vượt bậc cho khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao ngay trong cuộc trò chuyện với GPT-4o mà không cần bắt đầu một phiên chat mới. Tuy nhiên, vẫn có một hạn chế nhỏ cho người dùng miễn phí của ChatGPT – ít nhất là ở thời điểm hiện tại.
ChatGPT GPT-4o: Bước Tiến Vượt Bậc trong Tạo Hình Ảnh AI
Mô hình GPT-4o của OpenAI từ lâu đã trở thành lựa chọn hàng đầu cho hầu hết các cuộc trò chuyện mặc định trên ChatGPT. Nó có thể xử lý một loạt các câu hỏi rộng lớn, được OpenAI mô tả là “Tuyệt vời cho hầu hết các câu hỏi”. Và điều này đúng, GPT-4o cung cấp thông tin nhanh chóng và chính xác, nhưng trước đây chỉ dừng lại ở dạng văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với chi tiết đáng kinh ngạc, vượt trội so với mô hình mà nó gần như thay thế là DALL-E 3. Hơn thế nữa, GPT-4o giờ đây còn có khả năng thực hiện các tác vụ chỉnh sửa và điều chỉnh hình ảnh vượt xa giới hạn của DALL-E 3. Các tác vụ như chỉnh sửa hình ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm/bớt vật thể tiền cảnh và hậu cảnh, và nhiều khả năng khác đều đã trở nên khả thi.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện một cách đáng kinh ngạc. Khả năng tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (dù đây cũng không phải là điểm mạnh của hầu hết các mô hình AI). Giờ đây, GPT-4o có thể tạo ra các infographics chi tiết với lời giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh được đặt chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra hình ảnh AI bị mờ nhòe. Việc giữ lại chi tiết cũng là một cải tiến rõ rệt khác, với các đặc điểm cụ thể giờ đây có thể dễ dàng chuyển đổi từ hình ảnh này sang hình ảnh khác mà không làm ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Một phần của chất lượng hình ảnh được nâng cấp đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên nhiều yêu cầu tạo hình ảnh khác nhau, và quá trình này chỉ cần “hơn 100 nhân công” để hoàn thành. Khả năng tạo hình ảnh mới của ChatGPT thực sự rất ấn tượng, và chúng tôi khuyên mọi người nên thử nó với bất kỳ chủ đề nào bạn muốn. Dĩ nhiên, nó chưa hoàn hảo; không có công cụ tạo hình ảnh AI nào hoàn hảo cả. Nhưng đây là một bước nhảy vọt đáng kể về chất lượng từ một mô hình tạo hình ảnh AI như DALL-E 3, vốn hữu ích nhưng chưa thực sự nổi bật, lên đến tầm mà GPT-4o hiện nay có thể đạt được.
Một người đàn ông giống Einstein đang ăn kem tại công viên trung tâm Central Park, hình ảnh tạo bởi GPT-4o
Cập Nhật Hình Ảnh Tuyệt Vời Của ChatGPT Đang Dần Đến Tay Mọi Người (Dù Có Chút Chậm Trễ)
Đáng tiếc, do nhu cầu sử dụng GPT-4o tăng đột biến chưa từng có, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO của OpenAI, Sam Altman, đã xác nhận sự chậm trễ này nhưng không đưa ra khoảng thời gian cụ thể cho việc kết thúc.
Sự gia tăng quan tâm đã được dự đoán, nhưng không đến mức lớn như vậy. Thật không may, điều đó có nghĩa là bạn sẽ phải chờ đợi lâu hơn một chút hoặc nâng cấp lên gói ChatGPT Plus với 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với thời điểm ra mắt mô hình nâng cấp trước đây của OpenAI, GPT-4.5.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh cũ của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có mốc thời gian cụ thể cho sự thay đổi này.
Kết luận
Bản cập nhật GPT-4o là một cột mốc quan trọng, khẳng định vị thế dẫn đầu của OpenAI trong lĩnh vực AI tạo sinh. Với khả năng tạo và chỉnh sửa hình ảnh vượt trội, cùng với cải tiến đáng kể trong việc tạo văn bản trong ảnh, GPT-4o hứa hẹn sẽ mở ra nhiều ứng dụng sáng tạo mới cho người dùng. Mặc dù người dùng miễn phí có thể cần chờ đợi, nhưng những giá trị mà GPT-4o mang lại chắc chắn sẽ rất xứng đáng. Hãy trải nghiệm và cho chúng tôi biết ý kiến của bạn về khả năng tạo hình ảnh mới này của ChatGPT!
Tài liệu tham khảo
- Introducing GPT-4o Image Generation
- OpenAI Claims Breakthrough In Image Creation for ChatGPT
- ChatGPT-4o vs. DALL-E Image Creation
- OpenAI Launches New GPT-4.5 AI Model