嗨,我是 Lun.AI
AI 繪圖能讓我們一秒上太空、下一秒入魔界,但它有個難以言喻的痛:
「我無法讓我的主角,在第二張圖裡長得跟第一張一樣。」
「每次打指令總是要不到我們想要的樣子。」
這就是「AI 繪圖」的挑戰。
一切的開端,是 Google 昨天發表了一篇關於 Gemini 圖像生成的更新文章,在 Gemini 應用程式中獲取最佳圖像生成和編輯效果的技巧。
以下是 Gemini 應用程式中圖像生成與編輯功能的重點整理:
Gemini 圖像生成的主要功能:
- 角色一致性: 在多張圖片和編輯中保持角色或物件外觀的一致性。
- 創意構圖: 將多個概念中的不同元素、主體和風格融合成單一的統一圖像。
- 局部編輯: 使用簡單的語言對圖像的特定部分進行精確編輯。
- 設計與外觀調整: 將一種概念的風格、紋理或設計應用於另一種概念。
- 邏輯與推理: 利用對現實世界的理解來生成複雜的場景或預測序列中的下一步。
撰寫有效提示的 6 個要素:
- 主體: 圖像中的人或物是什麼?請具體說明。
- 構圖: 畫面如何取景?(例如:特寫、廣角、低角度拍攝、人像)。
- 動作: 正在發生什麼事?
- 地點: 場景發生在哪裡?
- 風格: 整體美學是什麼?(例如:3D 動畫、黑色電影、水彩畫、照片級真實感)。
- 編輯說明: 若要修改現有圖像,請直接且具體地說明。
5 種創意提示技巧範例:
- 保持角色外觀: 在第一個提示中定義一個具有特定細節的角色,然後在後續提示中將該角色置於全新的情境中。
- 精確的局部修改: 使用直接、對話式的指令來修改圖像中的特定元素,而無需重新生成整個場景。
- 融合概念: 先生成兩張獨立的圖片,然後在第三個提示中將兩者的主體和環境結合。
- 調整和應用新風格: 在保持原始主體不變的情況下,應用新的風格、色調或紋理來徹底改變圖像的氛圍和美感。
- 運用邏輯和推理: 給予 Gemini 一個簡單的概念,讓其推理能力來建構細節,例如預測一個動作的後果。
我針對5 種創意提示技巧,發展後續的情境實際應用
情境一:保持角色外觀 (Preserve Character Appearance)
這個技巧的重點是,在第一則提示詞中詳細定義你的角色,之後就能在不同的場景和風格中重複使用同一個角色。
主題:創造一個原創的奇幻角色
- 提示詞 1 (建立角色):
- 中文:
一名年輕的精靈魔法師,他有銀色的長髮,眼睛是紫羅蘭色,穿著深藍色繡有星辰圖案的長袍,手裡拿著一根頂端有發光水晶的木製法杖。背景是古老的圖書館。
- English:
A young elf mage with long silver hair and violet eyes, wearing a dark blue robe embroidered with star patterns. He is holding a wooden staff with a glowing crystal on top. The background is an ancient library.
- 中文:
- 提示詞 2 (改變場景與動作):
- 中文:
現在,讓同一個精靈魔法師站在夜晚的森林裡,他正在施展魔法,法杖頂端的水晶發出更耀眼的光芒,照亮了周圍的樹木。
- English:
Now, show the same elf mage standing in a forest at night. He is casting a spell, and the crystal on his staff is glowing brighter, illuminating the surrounding trees.
- 中文:
- 提示詞 3 (改變風格):
- 中文:
把這個精靈魔法師畫成日本動漫風格的樣子。
- English:
Draw this elf mage in a Japanese anime style.
- 中文:
情境二:精確的局部修改 (Precise Local Edits)
這個技巧適合用在微調圖片細節,例如產品設計、室內裝潢或修改照片。
主題:設計理想中的客廳
- 提示詞 1 (生成基礎圖片):
- 中文:
一張現代北歐風格的客廳照片,有淺灰色布沙發、圓形木製茶几,陽光從大片落地窗灑進來。
- English:
A photo of a modern Nordic-style living room with a light gray fabric sofa, a round wooden coffee table, and sunlight streaming in from a large floor-to-ceiling window.
- 中文:
- 提示詞 2 (修改顏色):
- 中文:
把沙發的顏色改成墨綠色。
- English:
Change the sofa's color to dark green.
- 中文:
- 提示詞 3 (增加物件):
- 中文:
在茶几上放一本打開的書和一杯咖啡。
- English:
Add an open book and a cup of coffee to the coffee table.
- 中文:
- 提示詞 4 (修改背景):
- 中文:
把窗外的景色從城市景觀改成一片海灘。
- English:
Change the view outside the window from a cityscape to a beach scene.
- 中文:
情境三:融合概念與創意構圖 (Blend Concepts)
將兩個或多個完全不相干的想法結合在一起,創造出超現實或極具創意的畫面。
主題:動物與科技的結合
- 提示詞 1 (生成圖片 A):
- 中文:
一隻威風凜凜的獅子,有著濃密的鬃毛,寫實攝影風格。
- English:
A majestic lion with a thick mane, photorealistic style.
- 中文:
- 提示詞 2 (生成圖片 B):
- 中文:
一套充滿未來感的、帶有霓虹光線的賽博龐克盔甲。
- English:
A futuristic suit of cyberpunk armor with neon lights.
- 中文:
- 提示詞 3 (結合兩者):
- 中文:
(上傳或引用前兩張圖)請讓這隻獅子穿上這套賽博龐克盔甲,背景是下著雨的未來東京街頭。
- English:
(Referencing the previous two images) Please make this lion wear this suit of cyberpunk armor, set against the backdrop of a rainy, futuristic Tokyo street.
- 中文:
情境四:調整和應用新風格 (Adapt and Apply New Styles)
保留圖片的主體內容,但將其完全轉換成另一種藝術風格。
主題:將一張照片藝術化
- 提示詞 1 (生成基礎圖片):
- 中文:
一張義大利古老街道的彩色照片,有一台偉士牌機車停在石板路上。
- English:
A color photograph of an old Italian street, with a Vespa scooter parked on the cobblestone road.
- 中文:
- 提示詞 2 (轉換風格):
- 中文:
將這張圖的風格變成梵谷的《星夜》油畫風格。
- English:
Change the style of this image to that of Van Gogh's "The Starry Night" oil painting.
- 中文:
- 提示詞 3 (嘗試另一種風格):
- 中文:
現在,把它變成黑白線條的簡約素描畫。
- English:
Now, turn it into a minimalist black and white line sketch.
- 中文:
情境五:運用邏輯和推理 (Use Logic and Reasoning)
讓 Gemini 根據現實世界的物理或因果關係,預測某個動作發生後的結果。
主題:一個簡單的物理場景
- 提示詞 1 (建立初始狀態):
- 中文:
一張圖片,顯示一個裝滿水的玻璃杯被安穩地放在桌子邊緣。
- English:
An image showing a glass full of water placed securely on the edge of a table.
- 中文:
- 提示詞 2 (觸發事件並預測結果):
- 中文:
生成一張圖,展示如果桌子被用力撞了一下會發生什麼事。
- English:
Generate an image showing what would happen if the table was bumped hard.
- 中文:
另一個範例:
- 提示詞 1:
- 中文:
一個小孩正在快樂地堆著一個很高的積木城堡。
- English:
A child is happily building a very tall castle out of toy blocks.
- 中文:
- 提示詞 2:
- 中文:
畫出他一不小心打噴嚏之後的樣子。
- English:
Draw what happens right after he accidentally sneezes.
- 中文:
目前的限制:
- 風格化: 風格化功能有時可能不一致或產生意想不到的結果。
- 文字渲染: 模型有時可能會拼錯單詞或難以處理複雜的排版。
- 角色特徵: 雖然模型在角色一致性方面表現出色,但並非總是能完美呈現。
- 長寬比: 模型在維持長寬比方面仍有困難,即使在提示中指定了尺寸,輸出也可能不符。
情境六:奇幻與科幻冒險 (Fantasy & Sci-Fi Adventure)
- 提示詞 (小巫師):
- 中文:
讓這隻垂耳兔穿上紫色的巫師袍,戴上尖頂巫師帽,坐在一堆古老的魔法書上,牠的爪子前面漂浮著一個小小的發光魔法球。
- English:
Have this lop-eared rabbit wear a purple wizard robe and a pointed wizard hat, sitting on a pile of ancient magic books, with a small glowing orb floating in front of its paws.
- 中文:
- 提示詞 (太空探險家):
- 中文:
把這隻垂耳兔畫成一名太空探險家,牠穿著一套合身的迷你太空衣,漂浮在銀河中,背景是遙遠的地球。
- English:
Illustrate this lop-eared rabbit as an astronaut, wearing a fitted miniature spacesuit, floating in the Milky Way with the distant Earth in the background.
- 中文:
情境七:職業與角色扮演 (Occupations & Role-Playing)
- 提示詞 (小畫家):
- 中文:
這隻垂耳兔戴著一頂貝雷帽,脖子上圍著小圍巾,牠的爪子拿著一支畫筆,面前是一個畫架,畫布上是牠畫的一根胡蘿蔔。
- English:
This lop-eared rabbit is wearing a beret and a small scarf around its neck. It's holding a paintbrush in its paw, in front of an easel with a canvas showing a carrot it painted.
- 中文:
- 提示詞 (偵探):
- 中文:
電影黑色風格,這隻垂耳兔穿著一件米色風衣,扮演一名偵探,在一個下著細雨的夜晚街道上,用放大鏡觀察地上的腳印。
- English:
Film noir style, this lop-eared rabbit is dressed in a beige trench coat, playing a detective, examining footprints on a dimly lit, rainy street at night with a magnifying glass.
- 中文:
情境八:模仿名畫與電影海報 (Imitating Famous Art & Movie Posters)
- 提示詞 (兔娜麗莎):
- 中文:
模仿達文西《蒙娜麗莎》的風格和構圖,但畫作的主角是這隻垂耳兔,牠帶著神秘的微笑,背景是文藝復興時期的風景。
- English:
Imitate the style and composition of Da Vinci's "Mona Lisa," but the subject of the painting is this lop-eared rabbit with a mysterious smile, against a Renaissance-style landscape.
- 中文:
- 提示詞 (電影海報):
- 中文:
為這隻垂耳兔設計一張動作電影海報,牠是主角。電影標題是《The Lop Identity》(垂耳兔的神鬼認證),背景要有爆炸和追逐的場景。
- English:
Design an action movie poster featuring this lop-eared rabbit as the hero. The movie title is "The Lop Identity," and the background should have explosions and chase scenes.
- 中文:
情境九:季節與節日主題 (Seasonal & Holiday Themes)
- 提示詞 (夏日海灘):
- 中文:
這隻垂耳兔戴著一副小太陽眼鏡,躺在沙灘椅上,旁邊放著一杯插著小雨傘的胡蘿蔔汁。
- English:
This lop-eared rabbit is wearing a pair of small sunglasses, lounging on a beach chair with a glass of carrot juice next to it, complete with a small umbrella.
- 中文:
- 提示詞 (聖誕節):
- 中文:
這隻垂耳兔戴著一頂聖誕帽,牠的周圍堆滿了禮物盒,背景是一個有溫暖壁爐的房間。
- English:
This lop-eared rabbit is wearing a Santa hat, surrounded by piles of gift boxes, in a room with a warm fireplace in the background.
- 中文:
情境十:抽象與概念藝術 (Abstract & Conceptual Art)
- 提示詞 (花朵構成):
- 中文:
這隻垂耳兔的身體輪廓完全由數百朵五顏六色的微小花朵和葉子構成,背景是純白色。
- English:
The entire silhouette of this lop-eared rabbit is composed of hundreds of tiny, colorful flowers and leaves, against a plain white background.
- 中文:
- 提示詞 (幾何圖形):
- 中文:
用立體主義風格重新詮釋這隻垂耳兔,將牠的身體分解成各種幾何形狀和色塊。
- English:
Reinterpret this lop-eared rabbit in a Cubist style, deconstructing its body into various geometric shapes and color blocks.
- 中文:
在開始創作前,我將 Google 官方的六大提示詞要素,內化成一套更易於記憶和使用的創意公式。在這裡,我將它與你分享:
AI 詠唱公式:
角色 (Persona) + 動作 (Action) + 場景 (Scene) + 風格 (Style) + 氛圍 (Atmosphere)
透過這套公式,我們可以像組合樂高一樣,系統性地建構出任何你想要的畫面。
1. 角色設定 (您的垂耳兔)
- 職業類: 廚師、偵探、畫家、科學家、飛行員、消防員、DJ、考古學家、圖書管理員
- 奇幻類: 巫師、騎士、國王/女王、精靈、龍騎士、鍊金術師、吟遊詩人
- 科幻類: 太空人、賽博格(半機械)、星際艦長、時間旅人、外星大使
- 歷史類: 古埃及法老、羅馬角鬥士、維京海盜、維多利亞時代的紳士/淑女、武士
- 搞怪類: 超級英雄、偽裝成植物的間諜、搖滾巨星、棉花糖怪獸
2. 正在做什麼 (動作)
- 日常活動: 烘焙蛋糕、喝下午茶、閱讀、彈吉他、織毛線、澆花
- 冒險活動: 探索古老遺跡、攀登高山、在深海中尋寶、駕駛飛船穿越小行星帶
- 專業活動: 進行化學實驗、在法庭上辯論、指揮交響樂團、修理機器人
- 魔法/科幻活動: 施放咒語、混合魔法藥水、啟動曲速引擎、與外星生物交流
3. 在什麼地方 (場景)
- 自然景觀: 螢火蟲飛舞的森林、漂浮在空中的島嶼、水晶洞穴、火山內部、櫻花盛開的庭園
- 建築內部: 巴黎的麵包店、蒸汽龐克風格的圖書館、未來科技實驗室、巴洛克風格的歌劇院
- 城市景觀: 賽博龐克風格的東京夜景、威尼斯的水上街道、古老的城堡頂端
- 超現實場景: 由糖果構成的世界、顛倒的城市、在雲朵上、書本堆成的山脈
4. 藝術風格 (畫風)
- 經典藝術: 文藝復興油畫、日本浮世繪、印象派、裝飾風藝術 (Art Deco)、超現實主義
- 現代媒體: 皮克斯 (Pixar) 3D動畫、吉卜力工作室動畫、8-bit 像素藝術、黏土動畫 (Claymation)
- 繪畫媒介: 麥克筆素描、色鉛筆插畫、水墨山水畫、粉彩畫
- 特殊材質: 彩色玻璃窗、馬賽克拼貼、霓虹燈藝術、羊毛氈玩偶
5. 特殊氛圍 (光影與元素)
- 光線: 黃金時刻的柔和光線、神秘的月光、閃爍的霓虹燈、溫暖的燭光
- 天氣: 細雨濛濛、落葉紛飛、陽光普照、暴風雪
- 情緒: 寧靜祥和、歡樂活潑、懸疑神秘、史詩般宏偉
- 特殊元素: 漂浮的音符、環繞身邊的蝴蝶、蒸汽龐克的齒輪和管道、魔法符文
組合範例 (實戰演練):
現在,我們用上面的「菜單」來隨機組合幾個全新的情境:
- 組合 1:
- [1] 鍊金術師 + [2] 混合魔法藥水 + [3] 蒸汽龐克風格的圖書館 + [4] 色鉛筆插畫風格 + [5] 溫暖的燭光
- 成品提示詞:
一隻扮演鍊金術師的垂耳兔,正在一個充滿齒輪和管道的蒸汽龐克圖書館裡,混合著發光的魔法藥水。整個畫面是色鉛筆插畫風格,並由溫暖的燭光照亮。
- 組合 2:
- [1] DJ + [2] 彈吉他 (混搭!) + [3] 漂浮在空中的島嶼 + [4] 吉卜力工作室動畫風格 + [5] 陽光普照
- 成品提示詞:
採用吉卜力工作室的動畫風格,畫一隻扮演DJ的垂耳兔,在一個漂浮於空中的島嶼上彈著電吉他,天氣陽光普照。
- 組合 3:
- [1] 考古學家 + [2] 探索古老遺跡 + [3] 水晶洞穴 + [4] 寫實攝影 + [5] 神秘的月光
- 成品提示詞:
一張寫實風格的照片,一隻戴著探險帽的考古學家垂耳兔,在一個巨大的水晶洞穴中探索古老遺跡,神秘的月光從洞口灑進來。
我把實驗結果寫在下一篇 下集
我如何用我家寵物,實戰 Gemini 最新發表技巧,意外撞上 AI 角色一致性的最大挑戰?(附獨家創意公式與解決策略)下