Stable Diffusion 用 prompt 控制鏡頭距離及角度

閱讀時間約 7 分鐘
在 Stable Diffusion 中用 prompt 控制鏡頭距離及角度

在 Stable Diffusion 中用 prompt 控制鏡頭距離及角度

在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。

電影拍攝時的鏡頭距離參考圖

電影拍攝時的鏡頭距離參考圖

此教學採用 Dark Sushu Mix Colorful 為 checkpoint

鏡頭距離

我們把可以使用的視角 prompt 放進 X/Y/Z plot 比較一下,為了突出效果要提高權重,盡量不要加入面部描述 e.g. beautiful face ,否則多數都會變成半身照。以下prompts 會加上 1.5 權重。

  • extreme close-up 超近鏡
  • close-up 近鏡
  • medium close-up 中近鏡
  • medium shot 中景鏡
  • long shot 遠鏡
  • establishing shot 場景鏡
  • point-of-view 主觀視角
  • cowboy shot 西部牛仔常用的鏡頭,見到上半身以及大腿(為了見到拔槍)
  • medium full shot 中風全景鏡
  • full shot 全景鏡
  • upper body 上半身
  • full body 全身
raw-image


出來的結果意外地有些 prompts 很相似,不過再配合其他 prompt 可以更穩定地控制距離。

  • extreme close-upclose-up 跟 medium close-up 都是放大眼睛/面部為主,但有時extreme close-up會放大更多。
  • medium shot , long shot , medium full shot  跟 full shot 看起來差不多,medium shot有時候會比 full shot 更近一點,都是顯示臀部以上到頭頂的位置,因應場景這幾個 prompt 的距離可能會有些變化。
  • establishing shot 的背景會比較明顯,如果主體是建築時人物可能會更細。
  • point-of-view 角度會因應人物有點轉變,背景通常比較 wide,角度跟主體未必是同一水平視角。
  • cowboy shot 受 cowboy 污染變了牛仔裝,距離跟 medium full shot 差不多但距離比較穩定,一定會顯示臀部以上到頭頂。
  • upper body 會顯示人身上半身,範圍可能由臀部以上到胸以上。
  • full body 是唯一可以見到全身的距離。

經測試後由近至遠可用的鏡頭 - extreme close-up > close-up > medium close-up > upper body > medium shot > medium full shot > full body 。

而 point-of-view 跟 establishing shot 會環境有所影響所以不適合控制距離。



鏡頭角度

攝影一樣有不同的拍攝角度術語可供參考

攝影一樣有不同的拍攝角度術語可供參考

掌握距離然後就是角度,由最基本的前後左右再加一些攝影角度,一樣加上 1.5 權重。

  • front view 正面
  • bilaterally symmetrical 左右對稱
  • side view 側面
  • back view 後面
  • from above 從上拍攝
  • from below 從下拍攝
  • from behind 後拍
  • wide angle view 廣角鏡
  • fisheyes view 魚眼鏡
  • macro view 微距
  • overhead shot 俯視
  • top down 由上向下
  • bird's eye view 鳥瞰
  • high angle 高角度
  • slightly above 微高角度
  • straight on 水平拍攝
  • hero view 英雄視角
  • low view 低視角
  • worm's eye view 仰視
  • selfie 自拍
多種視角 prompts

多種視角 prompts

另一批視角 Prompts

另一批視角 Prompts

出來的結果跟字面表示的角度差不多,也有些角度其實是重複的,也有一些受字面影響而受到污染。

  • front view  straight on 就是正面,但不一定是絕對正面,straight on 因為水平拍攝的角度所以背景也不會歪。
  • bilateral symmetry 正面兼左右對稱,比正面更準確。
  • side view 向左/向右都是隨機的。
  • back view 跟 from behind 都是背面, back view 會近一點,而且通常露背。
  • from above overhead shot  high angle slightly above 都是由高角度影向主體, overhead shot 角度較高, high angle 會背景比較闊一些。
  • from below 由下方偷拍 (?) 的視角,天空通常會筒狀變形。
  • wide angle 背景會有一些筒狀變形 fisheyes view 的變形效果會更強,但 fisheyes view 受到污染,總會拿著相機。
  • macro view 變了拍花或微細的物件。
  • bird's eye view 從高角度影高去同時會見到廣闊的背景,但會有雀鳥出現。
  • top down 的角度很糟糕 (?),變成正上方被女生抱住的視角。
  • hero view 角度不對,人物也受污染穿上了英雄戰衣。
  • low view 角度不算很低,有點懷疑沒有效果。
  • worm's eye view 完全錯了,有很多蟲及怪眼,跟角度完全沒關係。
  • selfie 人物會伸手自拍而且不會太遠。

其中 fisheyes view 雖然會污染但因為視角比較特別還是有用的,但 hero view 跟 worm's eye view 及  macro view 受污染角度又不明顯可以放棄。


距離+角度=取景

了解不同的鏡頭距離及角度後就可以輕鬆使用 prompt 生成出想要的取景。


1girl, beautiful, solo, (from above:1.5), (selfie:1.5), (close-up:1.5), in swimming pool

1girl, beautiful, solo, (from above:1.5), (selfie:1.5), (close-up:1.5), in swimming pool

1girl, beautiful, solo, (establishing shot:1.5), (side view:1.5), in a bus, reading

1girl, beautiful, solo, (establishing shot:1.5), (side view:1.5), in a bus, reading

1girl, beautiful, solo, (from below:1.5), (full body:1.5), night, street

1girl, beautiful, solo, (from below:1.5), (full body:1.5), night, street

1girl, beautiful, solo, (top down:1.5), (close-up1.5), lying in car

1girl, beautiful, solo, (top down:1.5), (close-up1.5), lying in car


總結

由於以 prompt 取景有時會受其他 prompt 影響,建議先用簡單 prompt 取景,然後用 controlnet 去固人物動作,既可以得到想要得畫面,並不怕人物受到影響。

avatar-img
10會員
6內容數
由淺入深,學習如何使用 Stable Diffusion 及研究各種 Stable Diffusion 軟件的使用方法,提示詞的意思及外掛軟件的教學。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Edmond Yip的沙龍 的其他內容
雖然網上有不少 Cloud 的 圖像生成 AI service,但是如果要大量/長期免費地使用,在本地安裝及依靠本機運算能力的 Stable Diffusion 是一個不錯的選擇。
雖然網上有不少 Cloud 的 圖像生成 AI service,但是如果要大量/長期免費地使用,在本地安裝及依靠本機運算能力的 Stable Diffusion 是一個不錯的選擇。
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
模特為被攝影師控制的對象,是為影像服務的人偶。 模特在一分鐘內,分別展現出了不耐、失神、微笑、陰鬱、狂喜、平靜。攝影家能決定要在哪一刻按下快門。
Thumbnail
構圖和拍攝角度是攝影中至關重要的元素,它們直接影響照片的故事性和美感。無論是拍攝單人、多人還是群體合照,如何合理安排人物的站位和姿勢,都能讓照片看起來更加自然和有趣。江國團將針對從一人到十人以上的構圖技巧進行詳細說明,特別是針對coser的拍攝,如何通過眼神、表情和站位來還原動漫中的氛圍
  前面淺談完了角色,這邊就來說說「場景」,也可以說是「環境」。   下一篇則是場景與鏡頭的最後:「特寫」。因與場景息息相關,因此如此先後。   為避免與分鏡重疊,所以這邊不會說太多,只會分享下手方向而已:D   ※再次聲明:以下提及的「畫面」、「鏡頭」等,都是將文字想像成「眼睛可見的實際演繹
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片。
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片~
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片,每篇內容會不斷更新。如果有任何理解錯誤或缺漏的的地方,歡迎聯繫我~ 什麼是鏡位(Shot Size)?
Thumbnail
人工智慧技術為攝影帶來新創意和可能性,透過不同鏡頭景深,呈現多樣化風格和視覺效果。本文介紹遠景、全景、中景、近景、特寫和廣角等不同攝影拍攝技巧。
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
下面使用一些關鍵字,來看看是否能嘗試控制鏡頭角度。不過,請注意,Stable Diffusion 派的 AI 生圖系統能否看懂提示詞?能看懂多少?是要看模型的,所以...
Thumbnail
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
模特為被攝影師控制的對象,是為影像服務的人偶。 模特在一分鐘內,分別展現出了不耐、失神、微笑、陰鬱、狂喜、平靜。攝影家能決定要在哪一刻按下快門。
Thumbnail
構圖和拍攝角度是攝影中至關重要的元素,它們直接影響照片的故事性和美感。無論是拍攝單人、多人還是群體合照,如何合理安排人物的站位和姿勢,都能讓照片看起來更加自然和有趣。江國團將針對從一人到十人以上的構圖技巧進行詳細說明,特別是針對coser的拍攝,如何通過眼神、表情和站位來還原動漫中的氛圍
  前面淺談完了角色,這邊就來說說「場景」,也可以說是「環境」。   下一篇則是場景與鏡頭的最後:「特寫」。因與場景息息相關,因此如此先後。   為避免與分鏡重疊,所以這邊不會說太多,只會分享下手方向而已:D   ※再次聲明:以下提及的「畫面」、「鏡頭」等,都是將文字想像成「眼睛可見的實際演繹
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片。
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片~
Thumbnail
本系列是紀錄我在Midjourney利用鏡頭語言和電影風格製作出來的圖片,測試如何與Midjourney溝通,製作出更符合我想法的圖片,每篇內容會不斷更新。如果有任何理解錯誤或缺漏的的地方,歡迎聯繫我~ 什麼是鏡位(Shot Size)?
Thumbnail
人工智慧技術為攝影帶來新創意和可能性,透過不同鏡頭景深,呈現多樣化風格和視覺效果。本文介紹遠景、全景、中景、近景、特寫和廣角等不同攝影拍攝技巧。
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
下面使用一些關鍵字,來看看是否能嘗試控制鏡頭角度。不過,請注意,Stable Diffusion 派的 AI 生圖系統能否看懂提示詞?能看懂多少?是要看模型的,所以...
Thumbnail
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。