AI makes painting - by Midjourney
身為對生成式AI充滿興趣的新手,除了上知天文下知地理的ChatGPT以外,大家最有興趣的應該就是AI繪圖了吧? 我跟大家一樣,最早被吸引進來也是被AI繪圖的神奇之處吸引進來,我自己是從小美術就沒有交出過像樣的畫圖過,所以雖然有接觸類似Photoshop之類的修圖工具,但是再怎麼厲害也只能修圖呢? 無中生有然後畫出屬於自己的美圖,這是從來沒有想像過的事情。 所以當AI繪圖橫空出世的時候,我馬上就產生了濃厚的興趣,也開始動手下去玩,這中間從完全不懂自己隨便亂玩,到真的投入心力並且到社群了解更多AI繪圖的知識,一路走來可以說學了非常多有趣的知識。
對於還完全沒有經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
第一個我們介紹的是生成式繪圖網站的始祖 Dall-E 網址如下
https://labs.openai.com/沒錯看網址就馬上明白了,這跟做出震驚全世界的ChatGPT的公司OpenAI是同一間,也是最早開放給大家使用生成式AI繪圖工具的公司。如果想要玩玩看得可以用你已經註冊好的OpenAI的帳號登入,就可以在這個網址畫圖了。
Dall-E的語法非常簡單,只要用英文輸入你想要的圖片就可以了。 我用同樣的一個指令來畫圖,也方便大家比較一下不同的繪圖工具如果不做任何調校,出來的結果大概是怎樣的。
為了能夠達到還不錯效果,我先用了一個稍微複雜一點的敘述,我希望看到的是一個忍者少女在廢墟般的街頭的照片,於是我給了如下的敘述”A modern digital painting of a beautiful ninja girl wearing kimono wielding a giant katana in ruined street.” 輸入的方法就是如圖這麼簡單
按下Generate按鈕,等個30秒圖面就會出現了。Dall-E產出的圖片如下
沒錯,確實意境是到了,也蠻好看的,但是圖片的精緻程度有限,而且最大最大解析度就到1024x1024 而已,要想要更精緻更精細其實不容易。這也是為什麼現在很少人繼續使用Dall-E來產生圖片。但是我們必須要瞭解到這是AI繪圖的始祖,而且也因為它是由OpenAI開發的,同樣提供了API可以讓其他的程式呼叫,所以其實有不少其他的繪圖軟體,其實是建立在這個Dall-E上面做開發的,我們下一位要介紹的選手Bing Image Creator其實就是這樣的。另外各位也會發現現在有很多用ChatGPT產生出來的聊天機器人有繪圖功能,這個繪圖功能其實也就是呼叫Dall-E繪圖的結果再把圖片傳回LINE,所以雖然Dall-E 目前並非主流的生成式AI繪圖工具,但還是非常重要的。
2. Bing Image Creator
下一個選手光看名字就知道是Microsoft開發的,沒錯這就是Microsoft建立於Open AI的Dall-E 上面提供的AI繪圖服務,而且很棒的是他也是完全免費的,想要使用的話只要到以下的網址輸入你想要的Prompt就可以了 (需要先登入Microsoft帳號,沒有的需要先申請,完全免費)
我們用同樣的Prompt ”A modern digital painting of a beautiful ninja girl wearing kimono wielding a giant katana in ruined street.”得到的圖片如下
是不是比起Dall-E精緻多了,也充滿了藝術感呢?(這是從嘗試2次總共8張裡面選出最佳的)。 Bing Image Creator是經過特別調校過的,所以雖然都是透過 Dall-E的引擎產生,但是能夠產出漂亮許多的照片,一般來說都非常的有美術感。如果各位不想要付錢,但是想要先嘗試看看AI繪圖的樂趣,我個人非常推薦就從Bing Image Creator開始。
3. Midjourney
Midjourney 是由同名的研究機構(公司)所開發的繪圖工具,這是一間私人的公司,而這個繪圖工具可以說是目前2D插畫師的最愛,為什麼呢? 請大家直接看用同一個Prompt 得到的畫面結果如下就知道了
Midjourney 不但可以產出非常高品質的畫作,且畫作的細節跟構圖都非常好,最重要的是,並不需要特別複雜的輸入指令(Prompt)就可以產出這些超高品質的圖片,所以可以說是市面上的AI繪圖軟體裡面使用起來最簡單最快,但是也很快可以提供立即可用的插畫的。實際上我的blog中絕大多數的畫作也都是用Midjourney產出的。 不過這麼好的東西用起來當然也有其代價,Midjourney 目前並沒有免費使用的方案,至少需要支付月費10美金才能夠使用,而且因為這個AI Model是私人的,所以如過要做一些特別的調整,舉例來說規範圖片中人物的姿態,或是把個人的臉等等插進去等等,目前都是做不到的,這些是目前私人AI Model的限制,上面介紹的幾種AI繪圖工具都是如此。
4. Stable Diffusion
我們最後要介紹的AI繪圖工具 Stable Diffusion 是由Stability.ai 這間公司所推出的開源軟體。你沒有看錯,這套Stable Diffusion是open source也就是完完全全免費的,而且因為開源的關係,這整套軟體從介面到AI Model都是可以調整的,而且可以安裝在自己的電腦上面運行,不需要連網都可以。不過要把這套軟體安裝在自己的電腦上面,對一般來說非工程背景的人來說是挺麻煩的,所以如果只是要體驗一下 Stable Diffusion的話,最快的方法就是到stability.ai 的網站
DreamStudio 去註冊並且體驗,不過credit用完的話就會需要花錢購買了。
既然要好好地玩AI,所以我當然是選擇了想辦法把這套軟體下載來安裝,安裝跟設定這套軟體的方法,我這邊就不詳述,推薦大家看看
這篇文章
裝好以後依照指示打開UI,哇馬上看到一大堆欄位跟選項,這到底是怎麼回事呢?
Stable Diffusion Automatic1111 GUI
然後假設我們什麼都不特別做,直接把上面的Prompt 輸入進Stable Diffusion裡面去跑,就得到以下的圖片
這…這圖片真的是太糟糕了…完全不能使用,咱到頗負盛名的Stable Diffusion就這樣而已嗎? 實際上,Stable diffusion 因為是完全免費的開源軟體,所以使用起來確實非常的"工程跟技術導向",而且相對有一定的學習門檻,也就是說完全沒有學習就來使用的話,就會得到像上面這樣的照片,但是如果經過學習的話,Stable Diffusion 可以做出各式各樣的風格,可以拿你個人的照片來訓練Model產出各種角色扮演的照片,也可以自由地控制人物的姿態,但是以初學者來說,Stable Diffusion可以說是非常非常不親近的。我接下來會開始分享更多關於這些AI繪畫工具的使用方式,其中絕大多數的篇幅就是會介紹這一套Stable Diffusion還有應用的方法。最後,附上一張同樣的基礎Prompt但是經過各種改寫跟調整,Stable Diffusion可以產出的圖片給各位看,是不是覺得值得學習得多了呢?