Stable Diffusion 用 prompt 控制鏡頭距離及角度

閱讀時間約 7 分鐘
在 Stable Diffusion 中用 prompt 控制鏡頭距離及角度

在 Stable Diffusion 中用 prompt 控制鏡頭距離及角度

在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。

電影拍攝時的鏡頭距離參考圖

電影拍攝時的鏡頭距離參考圖

此教學採用 Dark Sushu Mix Colorful 為 checkpoint

鏡頭距離

我們把可以使用的視角 prompt 放進 X/Y/Z plot 比較一下,為了突出效果要提高權重,盡量不要加入面部描述 e.g. beautiful face ,否則多數都會變成半身照。以下prompts 會加上 1.5 權重。

  • extreme close-up 超近鏡
  • close-up 近鏡
  • medium close-up 中近鏡
  • medium shot 中景鏡
  • long shot 遠鏡
  • establishing shot 場景鏡
  • point-of-view 主觀視角
  • cowboy shot 西部牛仔常用的鏡頭,見到上半身以及大腿(為了見到拔槍)
  • medium full shot 中風全景鏡
  • full shot 全景鏡
  • upper body 上半身
  • full body 全身
raw-image


出來的結果意外地有些 prompts 很相似,不過再配合其他 prompt 可以更穩定地控制距離。

  • extreme close-upclose-up 跟 medium close-up 都是放大眼睛/面部為主,但有時extreme close-up會放大更多。
  • medium shot , long shot , medium full shot  跟 full shot 看起來差不多,medium shot有時候會比 full shot 更近一點,都是顯示臀部以上到頭頂的位置,因應場景這幾個 prompt 的距離可能會有些變化。
  • establishing shot 的背景會比較明顯,如果主體是建築時人物可能會更細。
  • point-of-view 角度會因應人物有點轉變,背景通常比較 wide,角度跟主體未必是同一水平視角。
  • cowboy shot 受 cowboy 污染變了牛仔裝,距離跟 medium full shot 差不多但距離比較穩定,一定會顯示臀部以上到頭頂。
  • upper body 會顯示人身上半身,範圍可能由臀部以上到胸以上。
  • full body 是唯一可以見到全身的距離。

經測試後由近至遠可用的鏡頭 - extreme close-up > close-up > medium close-up > upper body > medium shot > medium full shot > full body 。

而 point-of-view 跟 establishing shot 會環境有所影響所以不適合控制距離。



鏡頭角度

攝影一樣有不同的拍攝角度術語可供參考

攝影一樣有不同的拍攝角度術語可供參考

掌握距離然後就是角度,由最基本的前後左右再加一些攝影角度,一樣加上 1.5 權重。

  • front view 正面
  • bilaterally symmetrical 左右對稱
  • side view 側面
  • back view 後面
  • from above 從上拍攝
  • from below 從下拍攝
  • from behind 後拍
  • wide angle view 廣角鏡
  • fisheyes view 魚眼鏡
  • macro view 微距
  • overhead shot 俯視
  • top down 由上向下
  • bird's eye view 鳥瞰
  • high angle 高角度
  • slightly above 微高角度
  • straight on 水平拍攝
  • hero view 英雄視角
  • low view 低視角
  • worm's eye view 仰視
  • selfie 自拍
多種視角 prompts

多種視角 prompts

另一批視角 Prompts

另一批視角 Prompts

出來的結果跟字面表示的角度差不多,也有些角度其實是重複的,也有一些受字面影響而受到污染。

  • front view  straight on 就是正面,但不一定是絕對正面,straight on 因為水平拍攝的角度所以背景也不會歪。
  • bilateral symmetry 正面兼左右對稱,比正面更準確。
  • side view 向左/向右都是隨機的。
  • back view 跟 from behind 都是背面, back view 會近一點,而且通常露背。
  • from above overhead shot  high angle slightly above 都是由高角度影向主體, overhead shot 角度較高, high angle 會背景比較闊一些。
  • from below 由下方偷拍 (?) 的視角,天空通常會筒狀變形。
  • wide angle 背景會有一些筒狀變形 fisheyes view 的變形效果會更強,但 fisheyes view 受到污染,總會拿著相機。
  • macro view 變了拍花或微細的物件。
  • bird's eye view 從高角度影高去同時會見到廣闊的背景,但會有雀鳥出現。
  • top down 的角度很糟糕 (?),變成正上方被女生抱住的視角。
  • hero view 角度不對,人物也受污染穿上了英雄戰衣。
  • low view 角度不算很低,有點懷疑沒有效果。
  • worm's eye view 完全錯了,有很多蟲及怪眼,跟角度完全沒關係。
  • selfie 人物會伸手自拍而且不會太遠。

其中 fisheyes view 雖然會污染但因為視角比較特別還是有用的,但 hero view 跟 worm's eye view 及  macro view 受污染角度又不明顯可以放棄。


距離+角度=取景

了解不同的鏡頭距離及角度後就可以輕鬆使用 prompt 生成出想要的取景。


1girl, beautiful, solo, (from above:1.5), (selfie:1.5), (close-up:1.5), in swimming pool

1girl, beautiful, solo, (from above:1.5), (selfie:1.5), (close-up:1.5), in swimming pool

1girl, beautiful, solo, (establishing shot:1.5), (side view:1.5), in a bus, reading

1girl, beautiful, solo, (establishing shot:1.5), (side view:1.5), in a bus, reading

1girl, beautiful, solo, (from below:1.5), (full body:1.5), night, street

1girl, beautiful, solo, (from below:1.5), (full body:1.5), night, street

1girl, beautiful, solo, (top down:1.5), (close-up1.5), lying in car

1girl, beautiful, solo, (top down:1.5), (close-up1.5), lying in car


總結

由於以 prompt 取景有時會受其他 prompt 影響,建議先用簡單 prompt 取景,然後用 controlnet 去固人物動作,既可以得到想要得畫面,並不怕人物受到影響。

9會員
6內容數
由淺入深,學習如何使用 Stable Diffusion 及研究各種 Stable Diffusion 軟件的使用方法,提示詞的意思及外掛軟件的教學。
留言0
查看全部
發表第一個留言支持創作者!
Edmond Yip的沙龍 的其他內容
雖然網上有不少 Cloud 的 圖像生成 AI service,但是如果要大量/長期免費地使用,在本地安裝及依靠本機運算能力的 Stable Diffusion 是一個不錯的選擇。
雖然網上有不少 Cloud 的 圖像生成 AI service,但是如果要大量/長期免費地使用,在本地安裝及依靠本機運算能力的 Stable Diffusion 是一個不錯的選擇。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
修圖的時候,有沒有遇過「如果當初再左邊一點就好了!」「如果當初廣角一點就好了!」以前只能想辦法手工 P 出來,但靠 Stable Diffusion + ControlNet 新推出的 Inpaint 模型,除了可以做圖片內修補外,也能往外擴展補完圖片 (outpaintng)!實在太強了!趕快來看
Thumbnail
本篇要來分享一個很簡單但是效果非常有趣的提示詞風格,就是上圖所見的公仔風。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
這篇文章會跟各位解說如何利用Stable Diffusion生成有各人風格的QR Code並且實際可掃,這是一篇進階教學文章,需要有使用Stable diffusion以及Controlnet經驗的人才能順暢的閱讀並且使用。
Thumbnail
來講各種不同的局部重繪(Inpaint)設定適合用在哪些情況。 目前局部重繪提供四種不同的填充內容(Masked content):fill,original,latent noise,latent nothing,這四種方法填充的東西都不一樣。使用的情況也都不同。
Thumbnail
前言 目前AI在室內設計領域已經取得了一定的進展,但尚未完全能夠取代室內設計師的工作。AI在室內設計中的應用主要包括幫助設計師進行設計、提供設計建議和測試不同的設計方案等。 室內設計涉及許多複雜的因素,包括空間配置、人性化需求、材料選擇、色彩搭配等。這些方面需要考慮到個人喜好、使用者的需求、環境因素
Thumbnail
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
Thumbnail
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
環境提示詞通常需要比較大的尺寸才會出現效果,太小的尺寸因為AI著重在主要對象,如果剩下空間不夠填充,環境提示詞有比較大機率被省略。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
修圖的時候,有沒有遇過「如果當初再左邊一點就好了!」「如果當初廣角一點就好了!」以前只能想辦法手工 P 出來,但靠 Stable Diffusion + ControlNet 新推出的 Inpaint 模型,除了可以做圖片內修補外,也能往外擴展補完圖片 (outpaintng)!實在太強了!趕快來看
Thumbnail
本篇要來分享一個很簡單但是效果非常有趣的提示詞風格,就是上圖所見的公仔風。
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
這篇文章會跟各位解說如何利用Stable Diffusion生成有各人風格的QR Code並且實際可掃,這是一篇進階教學文章,需要有使用Stable diffusion以及Controlnet經驗的人才能順暢的閱讀並且使用。
Thumbnail
來講各種不同的局部重繪(Inpaint)設定適合用在哪些情況。 目前局部重繪提供四種不同的填充內容(Masked content):fill,original,latent noise,latent nothing,這四種方法填充的東西都不一樣。使用的情況也都不同。
Thumbnail
前言 目前AI在室內設計領域已經取得了一定的進展,但尚未完全能夠取代室內設計師的工作。AI在室內設計中的應用主要包括幫助設計師進行設計、提供設計建議和測試不同的設計方案等。 室內設計涉及許多複雜的因素,包括空間配置、人性化需求、材料選擇、色彩搭配等。這些方面需要考慮到個人喜好、使用者的需求、環境因素
Thumbnail
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
Thumbnail
  用ACG圖片訓練出來的LoRA models,時有難以使用寫實風checkpoints models繪製出滿意成果的情況。
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
環境提示詞通常需要比較大的尺寸才會出現效果,太小的尺寸因為AI著重在主要對象,如果剩下空間不夠填充,環境提示詞有比較大機率被省略。