2025 年 3 月,OpenAI 宣布 ChatGPT-4o 內建生圖功能後,我的社群媒體瞬間被各式各樣的 AI 生成圖片淹沒——吉卜力風插畫、LINE 貼圖、應用教學影片鋪天蓋地而來。這場盛況,我覺得甚至比 Midjourney 2022 年底推出文字生圖時似乎還要來得更為浩大。

關鍵即在於 ChatGPT-4o 的易用性。
ChatGPT Plus 以上的訂閱用戶無需學習任何技巧,只要「會打字」就能生成高品質圖片,就像過往使用ChatGPT 一樣簡易,這讓 AI 生成圖片的門檻徹底降低,而全球各地的 KOL 爭相測試、比較、分享,更為 ChatGPT 再添一波熱潮。許多內容創作者也紛紛將 ChatGPT-4o 與 Midjourney或ComfyUI(Stable Diffusion)等主流生圖工具進行對比,發現 4o 在四個方面表現最為亮眼:
簡易直覺詠唱生成
ChatGPT-4o 完全拋開複雜參數設定,生圖就像「 聊天」一樣直覺,使用者也能透過與4o簡單對話,就能調整畫面細節,幾乎不需技巧。


輕鬆轉換風格
這幾天最流行的玩法之一,就是讓 ChatGPT-4o 把照片轉成吉卜力風插畫。不僅於此,無論是玩具、電玩、漫畫、油畫、素描、3D ...等風格,4o都能輕鬆應對。
只要將照片加入 ChatGPT 並用聊天的方式請他生成某種風格的插畫即可。例如:「幫我將上傳圖改成吉卜力風格的插畫」或是「幫我把這張照片改成《龍貓》風格的插畫」。
要特別注意的是詠唱詞不可直接加入作者名稱,而是要用作品的名稱取代,才不會被ChatGPT 拒絕生成哦。

⬆ 吉卜力風格插畫

⬆ 動物森友會風格

⬆ 樂高風格
生成可讀文字
過去 AI 生圖工具難以生成正確的文字,但 ChatGPT-4o 已經能夠輸出清晰可讀的標誌、標語,甚至是完整的海報或資訊圖表設計。
目前測試的結果是英文能完美參照詠唱詞,但中文字還是會有些微瑕疵錯誤的情況。

還可以生成有趣的4格漫畫,可以發現中文字表現還是滿殘破的,不過稍加後製修正即可:

生成一致性
Midjourney 在維持角色一致性上,雖然在加入Character Reference (角色參照)和 Style Reference(風格參考)參數後,有了長足的進步,但使用上的確還是有些難度,而 ChatGPT-4o 能夠記住並重現相同角色特徵和風格,在不同的場景、情境中重現,很適合用於漫畫、動畫、電玩角色設計發展。
詠唱(聊天)範例:
請把上圖的貓咪放在類似電玩遊戲中角色選擇的畫面中,畫面中要加上貓的各種能力值,像是戰鬥力、睡眠時間、貪吃指數、必殺技為撒嬌和鬼哭神號。戰鬥力、睡眠時間、貪吃指數用3D小魚的方式呈現,戰鬥力3條小魚、睡眠時間5條小魚、貪吃指數5條小魚。背景請用哆啦A夢的風格畫上一個小學生的房間,但稍微有點景深模糊的感覺。畫面的比例為16:9 寛螢幕。

接下來,有請ChatGPT-4o 為你變換場景:
請把上圖的貓咪改為穿上圍裙,在一個可愛的日式廚房裡煮飯的場景圖

請把上圖的貓咪改為躺在沙發上一邊看漫畫一邊吃著薯片,薯片包裝放在地上,貓咪的右手拿著一片薯片。場景是可愛的客廳。

結論
ChatGPT-4o 內建的文字生圖功能,可以說是讓 ChatGPT 的功能更加臻於完善。ChatGPT不再僅僅是大型語言模型用以協助生成文字與各類資訊協作,也在其中內建添加了完整的以文生圖的功能,不再另外需要拉到DALL·E 進行生澀不全的生圖,讓整個 AI 輔助創作流程更加順暢,對於需要同時處理文本與圖像的使用者來說,無需在不同平台之間切換,提昇了生產力,確實是一個 AI 生成領域的重要里程碑。
以目前測試的結果來說,和 Midjourney 相比,ChatGPT-4o 的優點在於更直覺的生成圖片以及更精準的文字的生成。而 Midjourney仍然在藝術風格與細節掌控上略勝一籌,特別是對於高品質插畫、概念藝術或較複雜的風格需求來說,參數設定能夠產出更加細膩的作品。我認為對於不同生圖需求的人來說,兩者各有其優勢,並且可互補互通使用,創造更有趣的生成作品。
不過,要特別提醒的是,目前 OpenAI 針對 ChatGPT-4o 生成內容的法律立場比較模糊,目前還沒有明確說明 4o 生成圖像的商用規範,只在其使用條款中提到,使用者需確保其使用方式符合適用法律。建議在使用 ChatGPT-4o 生成圖像時,保持謹慎,如果打算商用 4o 生成的圖像,應遵循與 Midjourney 相似的自我審查原則:
- 避免過於明顯的風格模仿(如宮崎駿、迪士尼、知名插畫家、IP)。
- 不要直接使用 AI 生成的品牌標誌、角色形象,以免涉及商標或版權爭議。
- 若用於商業用途,應對 AI 生成圖進行後製或僅作為創作參考,並增加個人創作比例。
總的來說,ChatGPT-4o 的文字生圖功能為創作帶來了更高的便捷性,讓使用者能夠輕鬆地在單一平台內完成從構思、文字創作到圖像生成的完整流程。然而,AI 生成內容的法律框架仍在發展中,使用者在享受直覺便利的同時,潛在的法律風險也不可不審慎。相信隨著 AI 影像生成技術的進步,未來的規範與市場需求可能會進一步影響這類工具的發展方向,是值得大家持續關注的。