如何準確指示AI生成你要的圖?

三十好幾
發佈於身為職業轉譯者 個房間
2024/03/29閱讀時間約 2 分鐘

很快地,又來到了本週的說話時間。

接續上星期的話題,這個星期我和洪七在聊天中討論的是,如何運用GPT製作有畫面、有意義、有衝擊感又有記憶點的節目封面圖。內含:如何規避版權問題?若不透過臨摹,不輸入原始圖片,該如何讓AI自己畫出超擬真圖片?

聊到這件事的緣由是,我們自己的節目,起初是上傳到Firstory Studio的同時,也有手動上傳YouTube。而就在節目開始兩集之後,YouTube開啟了Podcast聲音串流的功能,只要在Firstory Studio上傳檔案,YouTube這邊會自動更新。

缺點是,因為Firstory的單集封面圖是正方形的,被YouTube直接抓過來之後,顯示的就是正方形的,就算重新上傳長方形、符合YouTube規格的封面圖,它也只會在列表顯示出來,一旦進入播放模式,就無法完整顯示出原來的版本了。

以上關於圖片的背景說明,想要跟大家分享的是,我真心覺得七公是幽默的製圖大師。他生產的封面圖片,總有一種在開玩笑的感覺,既符合標題,又有一點自嘲。只不過,多半還是需要聽過內容在說什麼之後,才能get到為什麼圖片這樣畫。


那麼如何用AI畫圖?

目前,列表上所有的圖片都是七公和AI做出來的,示意如下:

小廢物如我,每次都讓七公自己製圖。

其實也不是我不想幫忙,曾經有一次因為七公比較忙,所以我就想說,那我也來試試看吧。但實際操作之後才發現——雖然透過ChatGPT依據標題或者某些特定的文字,讓它產出一張圖是可以的,但問題是,那就是一張圖,可能是某一個場景的示意圖,換句話說,那就只是我去Pixabay用某個關鍵字去找到有類似感覺或場景的圖……。

但七公製作出來的圖,卻充滿互動感。

換句話說,他其實已經有了圖片的劇情腳本、想好了場景的設定,然後才指示GPT去幫他把腦中所想的畫面具象化。如同之前對於AIGC對創作者的助力與限制?的討論:

和它合作,並沒有固定的通用咒語,但有不變的原則就是——我必須很清楚知道自己要做什麼,包含什麼樣的產出結果是合乎標準的?

使用GPT製作文案或「憑空」生產內容,若要達到最佳的產出效果,首先對於自己要處理的內容必須達到專業等級的理解,而不僅只是粗淺的認知。換句話說,對於目標和內容的掌握度,決定了我們和ChatGPT合作的成效與產出品質。

知道的目標的結果,即為掌握和AI協作的主導權。最後,透過本集節目中,七公分享的如何對AI下畫圖指令的方法,很有機會可以製作出理想的圖片。

最後微破梗分享:在這次的討論中,我覺得最有趣的是,我們除了可以自己掌握文字的精準度之外,甚至也可以要求AI透過文字來描述一個畫面。如此一來,由AI所產出的對於影像的描述,不僅可以為我們所用,同時,我們也可以藉此得知,AI是用什麼樣的方式在描述與剖析一個影像或畫面的。

是不是很有趣?

69會員
92內容數
我和我的日常觀察、讀書筆記,還有基於個人生活經驗的反思與體驗; 我和你和他的互動、以及跨越不同社會關係網絡而激起的煙花、水花與火花。
留言0
查看全部
發表第一個留言支持創作者!