Google 最近為其 Pixel 9 手機上的 Pixel Studio 應用推出了一項令人興奮的新功能:生成人物影像。這項功能在幾週前已宣布,現已開始推送至設備,為 Google 的內建 AI 影像生成器帶來重大飛躍。然而,作為一項尚處初期的技術,其成果可謂五味雜陳——有時令人驚艷,有時卻讓人毛骨悚然。
優點與缺點:驚喜與驚嚇並存
Pixel Studio 是 Google 專為 Pixel 9 系列打造的內建 AI 影像生成應用,無法在早期 Pixel 型號或其他品牌手機上使用。它基於文本提示運作:用戶輸入描述,應用便生成對應影像。與 Apple 的 Image Playground(僅限 iPhone,生成可愛卡通風格圖像)不同,Pixel Studio 主打逼真的影像生成,雖然也能按需求切換成「卡通風格」或「水彩畫風格」等形式。這種多功能性讓它在手機端的 AI 影像生成領域脫穎而出,更接近專業級工具的體驗。
Pixel Studio 的人物生成功能還在調整階段,Google 在應用啟動時就提醒用戶:「此功能仍在完善中,可能會出現意外的影像結果。」但即便有了心理準備,有些生成結果還是讓人瞠目結舌。例如,當我要求生成「一名運動員」的影像時,結果卻是一個沒有皮膚的男性圖像——不僅令人震驚,還完全偏離了我的期望。這不僅是技術上的失誤,更像是一場視覺噩夢。不過,Pixel Studio 在生成其他職業人物時表現得稍好一些,比如醫生、救護員或警察。但有趣的是,這些職業的影像往往偏向男性形象,顯示出 AI 在性別平衡上的潛在偏見。雖然質量不穩定,但當它正常運作時,生成的真實風格人物確實令人印象深刻,足以媲美頂尖 AI 工具如 Midjourney 或 Imagen 3。
AI 影像生成正在不斷地的進化
AI 影像技術近期進步神速。Google 剛在 Gemini AI 中新增了原生影像生成與編輯功能,但目前僅限於開發者工具 Google AI Studio。這個免費平台雖然強大,但使用起來不如主流 Gemini 應用那樣直觀。另一方面,OpenAI 的 ChatGPT 也在其 4o 模型中加入了影像生成功能,而 xAI 的 Grok 3 現在也能編輯影像。這些升級讓 AI 影像生成領域的競爭愈發激烈,未來我計畫對這些工具進行測試與比較,看看誰能拔得頭籌。
Pixel Studio 的人物生成功能雖然不完美,但展現了 Google 在 AI 影像領域的野心。從生成逼真人物到提供風格多樣性,它試圖將專業級創作工具帶入普通用戶手中。對比 Apple 的卡通路線,Google 的真實風格更具挑戰性,也更具潛力。當然,偶爾的「無皮運動員」這樣的失誤提醒我們,這項技術還有很長的路要走。
結語
Pixel Studio 的人物生成功能是個令人興奮的起點,但目前仍像個半成品——充滿潛力卻也漏洞百出。AI 影像生成的未來,值得期待!