如何準確指示AI生成你要的圖?

如何準確指示AI生成你要的圖?

更新於 發佈於 閱讀時間約 2 分鐘

很快地,又來到了本週的說話時間。


@洪

接續上星期的話題,這個星期我和洪七在聊天中討論的是,如何運用GPT製作有畫面、有意義、有衝擊感又有記憶點的節目封面圖。內含:如何規避版權問題?若不透過臨摹,不輸入原始圖片,該如何讓AI自己畫出超擬真圖片?

聊到這件事的緣由是,我們自己的節目,起初是上傳到Firstory Studio的同時,也有手動上傳YouTube。而就在節目開始兩集之後,YouTube開啟了Podcast聲音串流的功能,只要在Firstory Studio上傳檔案,YouTube這邊會自動更新。

缺點是,因為Firstory的單集封面圖是正方形的,被YouTube直接抓過來之後,顯示的就是正方形的,就算重新上傳長方形、符合YouTube規格的封面圖,它也只會在列表顯示出來,一旦進入播放模式,就無法完整顯示出原來的版本了。

以上關於圖片的背景說明,想要跟大家分享的是,我真心覺得七公是幽默的製圖大師。他生產的封面圖片,總有一種在開玩笑的感覺,既符合標題,又有一點自嘲。只不過,多半還是需要聽過內容在說什麼之後,才能get到為什麼圖片這樣畫。


那麼如何用AI畫圖?

目前,列表上所有的圖片都是七公和AI做出來的,示意如下:

小廢物如我,每次都讓七公自己製圖。

其實也不是我不想幫忙,曾經有一次因為七公比較忙,所以我就想說,那我也來試試看吧。但實際操作之後才發現——雖然透過ChatGPT依據標題或者某些特定的文字,讓它產出一張圖是可以的,但問題是,那就是一張圖,可能是某一個場景的示意圖,換句話說,那就只是我去Pixabay用某個關鍵字去找到有類似感覺或場景的圖……。

但七公製作出來的圖,卻充滿互動感。

換句話說,他其實已經有了圖片的劇情腳本、想好了場景的設定,然後才指示GPT去幫他把腦中所想的畫面具象化。如同之前對於AIGC對創作者的助力與限制?的討論:

和它合作,並沒有固定的通用咒語,但有不變的原則就是——我必須很清楚知道自己要做什麼,包含什麼樣的產出結果是合乎標準的?

使用GPT製作文案或「憑空」生產內容,若要達到最佳的產出效果,首先對於自己要處理的內容必須達到專業等級的理解,而不僅只是粗淺的認知。換句話說,對於目標和內容的掌握度,決定了我們和ChatGPT合作的成效與產出品質。

知道的目標的結果,即為掌握和AI協作的主導權。最後,透過本集節目中,七公分享的如何對AI下畫圖指令的方法,很有機會可以製作出理想的圖片。

最後微破梗分享:在這次的討論中,我覺得最有趣的是,我們除了可以自己掌握文字的精準度之外,甚至也可以要求AI透過文字來描述一個畫面。如此一來,由AI所產出的對於影像的描述,不僅可以為我們所用,同時,我們也可以藉此得知,AI是用什麼樣的方式在描述與剖析一個影像或畫面的。

是不是很有趣?

avatar-img
Sylvie的移動城堡
71會員
107內容數
我和我的日常觀察、讀書筆記,還有基於個人生活經驗的反思與體驗; 我和你和他的互動、以及跨越不同社會關係網絡而激起的煙花、水花與火花。
留言
avatar-img
留言分享你的想法!
Sylvie的移動城堡 的其他內容
因為工作的關係,時常在寫英文;而最近因為英語演講會的社團活動,寫英文演講稿的頻率更高了。這一年多下來,想分享一下一個超好用的外掛程式:Grammarly。 雖然有ChatGPT,但是尚未能勝過的Grammarly。 在網路上搜了一番,發現有人寫過類似的分享,如果是完全不認識Grammarly的人
5/5Grammarly
從去年的八月開始,我便作為guest去旁聽了不同的分會,初步參與到他們的活動中,並藉此了解不同分會的特性與氛圍,累計參與過六個在台北各個地方的分會活動,其中有兩個是雙語分會(中英文隔週),四個是全英文分會。
2023年4月,紐約成立的Runway AI發佈了一段用AI生成的影音:畫面模糊、卡頓,物體扭曲,僅時長4秒;四個月後,Runway將文生成影音的效果推向4K超高清,實現鏡頭的連貫穩定,長度也從4秒提升至18秒——這是2023年文生成影音的「時長天花板」。
因為工作的關係,時常在寫英文;而最近因為英語演講會的社團活動,寫英文演講稿的頻率更高了。這一年多下來,想分享一下一個超好用的外掛程式:Grammarly。 雖然有ChatGPT,但是尚未能勝過的Grammarly。 在網路上搜了一番,發現有人寫過類似的分享,如果是完全不認識Grammarly的人
5/5Grammarly
從去年的八月開始,我便作為guest去旁聽了不同的分會,初步參與到他們的活動中,並藉此了解不同分會的特性與氛圍,累計參與過六個在台北各個地方的分會活動,其中有兩個是雙語分會(中英文隔週),四個是全英文分會。
2023年4月,紐約成立的Runway AI發佈了一段用AI生成的影音:畫面模糊、卡頓,物體扭曲,僅時長4秒;四個月後,Runway將文生成影音的效果推向4K超高清,實現鏡頭的連貫穩定,長度也從4秒提升至18秒——這是2023年文生成影音的「時長天花板」。