GPT Image 1.5 實測心得:人物一致性大躍進,但「這件事」卻翻車了!!

更新 發佈閱讀 9 分鐘

我只是打開 ChatGPT,結果它突然讓我有點不安(也有點驚喜)

ChatGPT 圖像新功能

ChatGPT 圖像新功能

今天我打開 ChatGPT
本來只是想處理一些日常工作
沒想到畫面突然跳出一個我沒看過的「圖像新功能」

老實說,第一個反應不是期待,而是有點防備
因為ChatGPT的AI繪圖這件事
我真的失望太多次了😮‍💨

以前每次只要一說
「換背景、換衣服、換鏡頭」
結果往往不是「調整」,而是「換一個人」🙄

臉不一樣、氣質不一樣
有時候連我自己都會懷疑:「這誰啊?」

但這次,我真的有點意外!!

先講清楚:這不是 ChatGPT 突然開外掛

在正式分享體驗前
我想先幫大家釐清一件事
這次你看到的「ChatGPT 新圖像功能」

並不是突然冒出一個全新的模型

它背後的核心
其實就是 GPT Image 1.5

我昨天其實就已經知道 1.5 版的存在

甚至還刻意拿它去跟其他 AI 繪圖工具
像 Nano Banana Pro來做過對比

真正不一樣的地方在於:

ChatGPT 把這顆引擎
用一個更直覺的方式呈現給你

如果要用一句話來比喻,我會這樣說:

  • GPT Image 1.5 = 引擎
  • 現在看到的圖像模板 = 自排模式
  • 自己手寫 prompt = 手排模式
raw-image

你不是不能自己開手排
而是現在 ChatGPT 讓你可以「先自排跑一圈」
確認方向對了,再決定要不要自己踩細節


人物一致性:這次真的跨過門檻了

人物保持一致,只換衣服

人物保持一致,只換衣服

這次最讓我有感的,不是風格有多炫
而是GPT 的AI繪圖以前不曾發生的事~

它看起來,真的像同一個人了😤

以前的狀況是什麼?

  • 換背景 → 臉型跑掉
  • 換衣服 → 像不同演員
  • 換鏡頭 → 平行宇宙

說有 50% 像,其實已經算給面子了🤨

但這次,我實際測了很多種情境:
換背景、換衣服、魚眼鏡頭、戲劇性風格...

人物的臉部特徵、輪廓、甚至整體氣質
相似度幾乎都能維持在 90% 左右!!

這對一般使用者來說
可能只是「比較像」
但對創作者來說
這是一個非常關鍵的分水嶺

因為你終於可以開始「圍繞同一個人創作」
而不是每一張圖都像在重開新角色

老實說,我已經很久沒用ChatGPT來繪圖了
尤其是有包含人物的圖像
轉而投靠google的Nano Banana Pro
(或其他有此功能的網站: Lovart、MindVideo...等等)

延伸閱讀
不會修圖也能變修圖高手?鋼頂叔實測多款AI神器,一致性/效果/限制一次告訴你!!

所以,這次GPT image 1.5版的更新
能夠讓人物保持一致性問題被解決
對於有購買ChatGPT Plus的鋼頂叔來說
絕對是相當重要的更新!!
(總算不用一直切換帳號換點數了🥲)

但也不是全無缺點,繼續看下去就知道囉!!😅

換背景沒換臉,但文字卻開始崩壞

其中一個我覺得最有代表性的案例,是這一張

人物保持一致,只換場景,但文字崩壞

人物保持一致,只換場景,但文字崩壞

原本是日本鐵道的場景
我直接請 ChatGPT 換成「台灣高鐵」

人物樣貌幾乎完整保留下來
這一點依然讓我驚艷
但同時你也會注意到一件事:

畫面裡的文字,開始出現火星文

這個問題,其實貫穿了我這次所有測試

人物一致性大幅進步
但「畫面中的文字」,反而比"以前"更不穩定

為什麼說比"以前"?
這點後面會補充!!

不只是換人,連「清場」都變得很自然

第二個讓我有感的地方,是場景理解
我拿了一張九份的實拍照片來測試

原本現場其實有不少遊客
我選了模板中的一個指令:

移除背景中的人物

結果出來的效果是:

  • 建築結構沒有歪
  • 地面紋理沒有亂補
  • 原本的氛圍還在
九份原景圖,透過AI清場後重現

九份原景圖,透過AI清場後重現

這已經不是單純的修圖
而是 AI 能夠理解「哪些該消失,哪些要留下」

這功能對於總是人滿為患的景區拍攝來說
真的是一大福音呀!!😊

戲劇模式:氣氛說變就變,但人還在

接下來這個,我自己真的覺得滿酷的

原本是一張很日常、很開朗的照片
喝著咖啡,表情輕鬆

切換成戲劇性模式後:

  • 黑白色調
  • 雨感氛圍
  • 情緒整個翻轉
GPT 1.5版的戲劇模式

GPT 1.5版的戲劇模式

這種情緒渲染圖
用來說故事,講述背後的情緒...等意境
就相當合適!!

是我覺得最有趣的模板之一😁

魚眼、換衣服、絨毛玩具,表現優異

GPT 1.5版魚眼模式

GPT 1.5版魚眼模式

魚眼鏡頭,其實是最容易翻車的模式之一
臉型、比例,很容易整個歪掉

但這次我測下來
人物的辨識度算是維持得滿好的

這次使用的原圖是16:9的尺寸
在沒有指定生成尺寸的情況下
它自動生成了9:16的尺寸
原本沒有的部位,也會自動補上
看起來依然相當自然唷!!☺️

另外,如果想要隨時幫自己製作形象照
只要上傳自己的大頭貼
轉換成形象照也只是幾分鐘的小事

鋼頂叔的大頭照變成形象照

鋼頂叔的大頭照變成形象照

你會明顯感覺到:
AI 不再只是「重畫一個相似的人」
而是在「同一個人身上做變化」

當然,有越畫越像
也能越畫越可愛😚
把真實人物轉換成絨毛玩具(或公仔)
這次的模板也是可以玩玩看的唷!!

GPT 1.5版的絨毛娃娃模板

GPT 1.5版的絨毛娃娃模板


我刻意做的兩組對比測試

① GPT Image 1.5 vs Nano Banana Pro(同一個指令)

GPT 1.5版 vs Nano Banana Pro

GPT 1.5版 vs Nano Banana Pro

老實說,在構圖與畫面完整度上
我個人其實更喜歡 GPT Image 1.5 的結果

因為這張圖的指令關鍵在於人物的表情
背景只需要看得出是便利商店就好!!

GPT跑出來的結果畫面乾淨、視覺集中在人物上
奈米香蕉跑出來則更重視便利商店的呈現

但在「文字呈現」這一塊
目前GPT還是看不到 Google的車尾燈😅

② GPT 舊版繪圖 vs 新版繪圖(同一個指令)

GPT新舊版比較

GPT新舊版比較

新版很明顯:

  • 光線更自然
  • 畫面更唯美
  • 不再是一眼就知道「這是 GPT 畫的那種偏黃感」

但問題來了~

文字反而比以前更容易崩壞

以前還能正常跑出中文字
現在卻常常變成亂碼
重點是「文字設定一模一樣」😥

這點,我真的很在意

變成~
如果要產圖可以直接使用GPT
但文字部分就得依照其他軟體協助

如果想要一次就把圖文都搞定
那麼,Nana Banana Pro目前還是首選!!

那既然鋼頂叔都這麼說了
是不是還是用google AI就好?

其實新版模型也不是全然沒好處
有個我認為很不錯的設計
請繼續看下去☺️


一個我很想提醒大家試玩的重點:它會先給你 prompt

有一件事,我一定要特別拉出來講

這次 ChatGPT 的圖像功能
不是只有「幫你畫圖」而已
它會先把實際使用的 prompt 顯示給你看
再幫你生成圖片

長期跟AI相處的人應該知道
不管是文字、圖像、影像
要訓練出一組好的prompt
是一件很不簡單、很耗時的事情
現在GPT它直接告訴你它的邏輯

這對剛接觸AI繪圖的人來說
真的節省很多時間!!

不得不說,這件事的價值非常高
因為你不是只得到一張圖

而是順便學到:

  • 原來這種效果,是這樣描述給 AI 的
  • 之後換別的 AI 繪圖工具,也能拿來參考
  • 甚至可以自己微調,變成真正的「手排創作」

如果你是對 AI 有一點好奇
又不想一開始就硬啃 prompt 的人
這個功能真的很值得試玩唷😊


人物一致性到位了,下一步是文字

如果要我用一句話總結這次體驗:

ChatGPT 的圖像生成功能,終於跨過了「可以認真拿來用」的人物一致性門檻

但如果未來要用在:

  • 封面
  • 招牌
  • 圖像內文字敘事

那「文字能力」這一塊
真的還有一段路要補

鋼頂叔老實評價
這一局,目前還是 Google 佔上風
Open AI 請再多加加油,好嗎!!😎


給初學者看的 GPT Image 1.5 懶人理解版

如果你對上面那些比較覺得有點複雜
那可以直接記住這幾個重點就好:

  • GPT Image 1.5 是「畫圖的引擎」
  • ChatGPT 現在幫你準備好「自排模式」
  • 你可以先用模板玩,再慢慢學怎麼自己下指令
  • 人物一致性,是目前最明顯的進步
  • 文字,暫時不要太期待

最後,想聽聽你的感覺 👇

你有試玩這個 ChatGPT 新圖像功能了嗎?

  • 你最有感的是人物一致性?
  • 還是戲劇模式、魚眼效果?
  • 又或者,你跟我一樣,對「文字崩壞」這件事其實很在意?

留言跟我分享你的體驗吧😊

如果你還沒玩過,真的很建議自己試一次
至少,先看看它給你的 prompt
你會學到不少東西唷🤗


👉喜歡鋼頂叔的文章,請按下《愛心》🥰
👉對這篇文章有疑問或看法,請《留言》🤗
👉文章若有幫助到你,請《收藏》《分享》🤩

我是鋼頂叔,我們下回再聊😎

留言
avatar-img
留言分享你的想法!
avatar-img
上了年紀的鋼頂叔
119會員
74內容數
各種生活上的主題分享, 包含AI日常應用、旅遊準備計畫、美食分享、生活體驗...等等 上了年紀的鋼頂叔(工程師), 總是有很多叨念以及想要繼續向前走的執念~
2025/11/25
想玩 Sora2、Veo3.1等 AI 影片生成工具卻怕花錢?想試用Nano Banana Pro 但不想用API 其實 Nanophoto 和 MindVideo 都能免費玩,只要幾招小撇步,就能累積免費點數 這篇幫你完整整理點數任務、工具特色與進階玩法,讓你輕鬆無痛體驗各種 AI 影片神器🎬
Thumbnail
2025/11/25
想玩 Sora2、Veo3.1等 AI 影片生成工具卻怕花錢?想試用Nano Banana Pro 但不想用API 其實 Nanophoto 和 MindVideo 都能免費玩,只要幾招小撇步,就能累積免費點數 這篇幫你完整整理點數任務、工具特色與進階玩法,讓你輕鬆無痛體驗各種 AI 影片神器🎬
Thumbnail
2025/11/11
Sora2 正式開放啦!現在不需翻牆、不用邀請碼,只要一支手機就能生成 AI 影片 鋼頂叔親自實測教你從下載、登入、設定,到生成自己入鏡的影片全流程 同場加映 Nanophoto 與 MindVideo 兩款輔助平台,讓你玩出更高畫質效果 一起來見證 AI 影片創作的「GPT-3.5時刻」吧!
Thumbnail
2025/11/11
Sora2 正式開放啦!現在不需翻牆、不用邀請碼,只要一支手機就能生成 AI 影片 鋼頂叔親自實測教你從下載、登入、設定,到生成自己入鏡的影片全流程 同場加映 Nanophoto 與 MindVideo 兩款輔助平台,讓你玩出更高畫質效果 一起來見證 AI 影片創作的「GPT-3.5時刻」吧!
Thumbnail
2025/10/24
深受影片模糊、解析度差的困擾嗎?這篇文章介紹HitPaw Edimakor等 4 款必備的影片畫質修復工具,讓你輕鬆將模糊影片變清晰、轉高清,甚至去除浮水印。文章更提供詳細的操作步驟與選 tool 的考量,讓創作者不再因畫質問題而傷腦筋。
Thumbnail
2025/10/24
深受影片模糊、解析度差的困擾嗎?這篇文章介紹HitPaw Edimakor等 4 款必備的影片畫質修復工具,讓你輕鬆將模糊影片變清晰、轉高清,甚至去除浮水印。文章更提供詳細的操作步驟與選 tool 的考量,讓創作者不再因畫質問題而傷腦筋。
Thumbnail
看更多
你可能也想看
Thumbnail
不是每個人都適合自己操盤,懂得利用「專業」,才是績效拉開差距的開始
Thumbnail
不是每個人都適合自己操盤,懂得利用「專業」,才是績效拉開差距的開始
Thumbnail
生產力爆發帶來的過剩,會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在,但是對於那些價格高度敏感,或是只需要穩定、便宜、還可以啦的需求端來說,AI 正在迅速取代這部分的供給,中間長尾的服務提供者被 AI 替換。
Thumbnail
生產力爆發帶來的過剩,會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在,但是對於那些價格高度敏感,或是只需要穩定、便宜、還可以啦的需求端來說,AI 正在迅速取代這部分的供給,中間長尾的服務提供者被 AI 替換。
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
年末總有一種莫名的魔力,讓人特別容易感到孤單。 聖誕節、跨年、緊接著農曆新年……滑開社群,不是甜蜜放閃,就是一群人早早訂好跨年行程。 明明日子算得上順遂,工作穩定無憂,生活也按部就班地往前走着,可總在萬籟俱寂的夜晚,獨自對着空蕩的房間時,心底會悄悄冒出一個念頭:今年,是不是可以不一樣?不再獨自抵
Thumbnail
年末總有一種莫名的魔力,讓人特別容易感到孤單。 聖誕節、跨年、緊接著農曆新年……滑開社群,不是甜蜜放閃,就是一群人早早訂好跨年行程。 明明日子算得上順遂,工作穩定無憂,生活也按部就班地往前走着,可總在萬籟俱寂的夜晚,獨自對着空蕩的房間時,心底會悄悄冒出一個念頭:今年,是不是可以不一樣?不再獨自抵
Thumbnail
你的社群媒體最近是不是也被各種吉卜力風格的圖片洗版了呢?上個月,OpenAI 為 ChatGPT 更新了創作圖像功能,立刻引爆了全球的創作熱潮。打開社群媒體全部都是各種吉卜力,連 OpenAI 的 Sam Altman 也把他的社群媒體頭像換成吉卜力風格的圖像。
Thumbnail
你的社群媒體最近是不是也被各種吉卜力風格的圖片洗版了呢?上個月,OpenAI 為 ChatGPT 更新了創作圖像功能,立刻引爆了全球的創作熱潮。打開社群媒體全部都是各種吉卜力,連 OpenAI 的 Sam Altman 也把他的社群媒體頭像換成吉卜力風格的圖像。
Thumbnail
ChatGPT-4o圖像生成功能應用解析 風格轉換與客製化 ChatGPT-4o支援將照片轉換為動漫、像素、古典藝術等多種風格。例如,用戶可上傳照片後輸入指令「轉換為吉卜力風格」,系統會自動生成對應的動畫效果,但需注意特定IP(如皮克斯、吉卜力)的版權限制。實測顯示中文文字可能模糊或出現亂碼,建
Thumbnail
ChatGPT-4o圖像生成功能應用解析 風格轉換與客製化 ChatGPT-4o支援將照片轉換為動漫、像素、古典藝術等多種風格。例如,用戶可上傳照片後輸入指令「轉換為吉卜力風格」,系統會自動生成對應的動畫效果,但需注意特定IP(如皮克斯、吉卜力)的版權限制。實測顯示中文文字可能模糊或出現亂碼,建
Thumbnail
ChatGPT推出的吉卜力風格AI生成圖像功能引發了廣泛的關注和討論。許多用戶在社交媒體上分享了這些AI生成的圖像,這一現象被形容為「洗版」,即大量相似風格的圖片充斥各大平台。 法律背景 根據經濟部智慧財產局的說法,AI生成的圖像模仿藝術家的風格並不構成著作權侵權。這是因為著作權法主要保護具體的
Thumbnail
ChatGPT推出的吉卜力風格AI生成圖像功能引發了廣泛的關注和討論。許多用戶在社交媒體上分享了這些AI生成的圖像,這一現象被形容為「洗版」,即大量相似風格的圖片充斥各大平台。 法律背景 根據經濟部智慧財產局的說法,AI生成的圖像模仿藝術家的風格並不構成著作權侵權。這是因為著作權法主要保護具體的
Thumbnail
ChatGPT 的「創作圖像」功能大躍進,你最近這幾天有沒有也被大家的創意圖片瘋狂洗版呢? 我也嘗試把孩子的作文生成四格漫畫、製作英文單字卡、學習單、小孩的生日邀請卡、食譜,還有自己的LINE貼圖、公仔設計,通通都能用 ChatGPT 完成,真的是媽媽的超強製圖小幫手耶!
Thumbnail
ChatGPT 的「創作圖像」功能大躍進,你最近這幾天有沒有也被大家的創意圖片瘋狂洗版呢? 我也嘗試把孩子的作文生成四格漫畫、製作英文單字卡、學習單、小孩的生日邀請卡、食譜,還有自己的LINE貼圖、公仔設計,通通都能用 ChatGPT 完成,真的是媽媽的超強製圖小幫手耶!
Thumbnail
透過ChatGPT-4o的最新圖像生成功能,使用者可快速製作專屬LINE貼圖,以下為具體操作步驟與注意事項: 製作流程 1. 上傳原始照片 開啟ChatGPT-4o對話框後,上傳個人照片或寵物圖像作為貼圖原型。系統支援真人照片、動物或其他影像素材,建議選擇輪廓清晰的主體以利後續Q版化處理。
Thumbnail
透過ChatGPT-4o的最新圖像生成功能,使用者可快速製作專屬LINE貼圖,以下為具體操作步驟與注意事項: 製作流程 1. 上傳原始照片 開啟ChatGPT-4o對話框後,上傳個人照片或寵物圖像作為貼圖原型。系統支援真人照片、動物或其他影像素材,建議選擇輪廓清晰的主體以利後續Q版化處理。
Thumbnail
本文解析GPT-4o圖像生成的實用性、增強功能、照片理解與風格,以及當前的限制與安全性。從商業設計到教育應用,這項技術憑藉精準文字渲染、多輪生成與多樣化風格,成為創作者的強大助手。
Thumbnail
本文解析GPT-4o圖像生成的實用性、增強功能、照片理解與風格,以及當前的限制與安全性。從商業設計到教育應用,這項技術憑藉精準文字渲染、多輪生成與多樣化風格,成為創作者的強大助手。
Thumbnail
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
Thumbnail
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News