生成式AI繪圖:呼叫Colab,自己也來畫個幾張吧!

更新於 2024/10/19閱讀時間約 6 分鐘
今年是AI大爆發的一年,從產生簡報、生成圖片,到Youtube出現AI生成的孫燕姿翻唱歌曲,無論在娛樂或提高工作生產力,生成式AI的潛力似乎才剛被發掘,還有更多應用可期待。今天要介紹幾個有名的AI繪圖服務,如果想要挑戰自己寫code產生圖片,記得看到文章最後喔(你的coding 魂被燃燒起來了嗎?)

有名的AI繪圖服務

今天要介紹幾個有名的AI繪圖服務,如果想要挑戰自己寫code產生圖片,記得看到文章最後喔(你的coding 魂被燃燒起來了嗎?)

Midjourney

目前Midjourney已經開始收費了,從每月8美元起跳。雖說沒付費就無法自己創作,但Midjourney本身是個社群平台,community showcase裡的創作的確還是很令人驚豔。

OpenAI DALL-E-2

DALL-E-2也是釋出ChatGPT的OpenAI開發的,到目前為止每個月他們提供使用者幾個免費credit產生圖片。免費圖片在圖的右下角會有個類似浮水印的彩色方塊小標記,但不明顯。只要提示詞給的好,圖片很有藝術感。

整體來說出圖速度快,圖片品質佳👍。

輸入 "summer plate, berries, kiwi, banana, happy cat flying"提示詞,DALL-E-2生成的作品

輸入 "summer plate, berries, kiwi, banana, happy cat flying"提示詞,DALL-E-2生成的作品


Craiyon

諧音類似英文的蠟筆,他們的logo也是蠟筆。同樣也提供免費服務,付費會員出圖速度較快。免費服務大約等個1~2分鐘可以得到9張圖,圖片上也有浮水印。(等待的時間會被強迫看很多廣告,畢竟 AI是個燒錢行業,總是要有些方法支持團隊營運)。下圖是相同提示詞生成的圖片:summer plate, berries, kiwi, banana, happy cat flying,可看出Craiyon產生的圖片風格與OpenAI 明顯不同。OpenAI對於這種天馬行空的提示詞,生成的圖片大多有點小清新配色柔和 ; 而Craiyon生成的作品常常給我一種時空扭曲的超現實感!

輸入 "summer plate, berries, kiwi, banana, happy cat flying"提示詞,Craiyon生成的作品

輸入 "summer plate, berries, kiwi, banana, happy cat flying"提示詞,Craiyon生成的作品

Colab + Tensorflow KerasCV (100% 免費)

這是100%免費的方案!自己寫python code產生。Tensorflow 在High-performance image generation using Stable Diffusion in KerasCV 這篇文章有很棒的範例,照著他的colab筆記本實作不算太困難。

若遇到缺套件,缺什麼就pip install安裝

直接來看成果:

輸入 "photograph of an astronaut riding a horse" StableDiffusion model 生成的作品

輸入 "photograph of an astronaut riding a horse" StableDiffusion model 生成的作品

輸入 "A cat family, fancy, pink and purple lovely background" StableDiffusion model 生成的作品

輸入 "A cat family, fancy, pink and purple lovely background" StableDiffusion model 生成的作品

第二張圖好像有點太pink and purple, 也太lovely了

心得

  • AI繪圖看似不難,想要畫得精緻美麗,關鍵在於提供AI精準的描述。所以將來無論你是文科生或理工仔,語文能力勢必更被看重。倘若你文筆好,便可借助AI畫出一口好圖!文字工作者與美術工作者藉著AI將有更多的交集!
  • 以後簡報缺圖片時,快開出colab 幫自己畫個幾張圖,還可避免誤用圖片有侵權的困擾
  • 下次要試試看讓ChatGPT幫忙產生提示詞 (歡迎分享成果)

StableDiffusion Model Python 程式碼範例

參考High-performance image generation using Stable Diffusion in KerasCV內容。可透過colab環境操作,若在本機操作,可能需要更新Tensorflow。

首先安裝需要的套件:

pip install tensorflow keras_cv --upgrade --quiet
pip install keras_core

產生圖片的Python程式碼:

#匯入需要的套件
import time
import keras_cv
from tensorflow import keras
import matplotlib.pyplot as plt

#使用Tensorflow提供的模型
model = keras_cv.models.StableDiffusion(img_width=512, img_height=512)

#匯入需要的套件,將提示詞填入" "當中, batch_size是產生圖片的數量。圖片越多需要時間越長。以下將產生3張圖片
images = model.text_to_image("photograph of an astronaut riding a horse", batch_size=3)

#畫出結果
def plot_images(images):
plt.figure(figsize=(20, 20))
for i in range(len(images)):
ax = plt.subplot(1, len(images), i + 1)
plt.imshow(images[i])
plt.axis("off")


plot_images(images)


文章同步發表於慧思科研雲端教室




avatar-img
14會員
9內容數
生活與工作的分享
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
在ChatGPT問世以來,大家已經感受到了生成式AI入侵各行各業的威力,但真正能夠從這個趨勢賺錢的企業,是位於價值鏈的哪個位置?一些號稱能抓到生成式AI機會的公司,會不會只是泡沫的hype實際上不可取代的程度低,做不出市場所需的差異化產品。 如果觀察上一代大型的科技循環,Mobile移動網路的趨勢,
(刊登於風傳媒,連結:www.storm.mg/article/4796622) 所以,很有意思地,為什麼在當今眾多發展的AI當中,竟然是由自然語言的大型語言模型,來讓人們驚覺有那麼一點通用人工智慧AGI的感覺和發展之可能方向。正是因為概念就藏在語言裡。
Thumbnail
去年底 ChatGPT 橫空出世,流暢的對答表現與驚人的資料統整力,讓人們震驚原來 AI 已經有如此超「人」能力。而 Midjourney 的出現,也讓很多人轉職成詠唱詩人,動動嘴就能畫好一幅畫(精準點說是打打鍵盤)。這些生成式AI 猛然打入人們的生活。
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。
Thumbnail
去年阿財有分享過自動駕駛技術各個解決方案的路線選擇,當時我就有提到過我認為傳統車廠為什麼不走純視覺路線的可能原因,這邊再稍微分享一下: 首先在講純視覺之前先了解一下目前純視覺是如何計算深度的,目前用相機拍到的影像計算深度有單目視覺、雙目視覺、運動結構恢復(sfm)等再搭配AI模型,可以搜尋Pseud
Thumbnail
ChatGPT, 生成式AI 開場影片 今天用AI生成的素材,利用Clipchamp製作影片。 Clipchamp文字轉語音功能,非常適合不露臉及錄音的創作者使用。 使用Clipchamp編輯 故事開始 小熊發明 ChatGPT,大受歡迎。 人們問他股市何時回穩,他回答:「我不確定,但如果你問 Ch
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
在ChatGPT問世以來,大家已經感受到了生成式AI入侵各行各業的威力,但真正能夠從這個趨勢賺錢的企業,是位於價值鏈的哪個位置?一些號稱能抓到生成式AI機會的公司,會不會只是泡沫的hype實際上不可取代的程度低,做不出市場所需的差異化產品。 如果觀察上一代大型的科技循環,Mobile移動網路的趨勢,
(刊登於風傳媒,連結:www.storm.mg/article/4796622) 所以,很有意思地,為什麼在當今眾多發展的AI當中,竟然是由自然語言的大型語言模型,來讓人們驚覺有那麼一點通用人工智慧AGI的感覺和發展之可能方向。正是因為概念就藏在語言裡。
Thumbnail
去年底 ChatGPT 橫空出世,流暢的對答表現與驚人的資料統整力,讓人們震驚原來 AI 已經有如此超「人」能力。而 Midjourney 的出現,也讓很多人轉職成詠唱詩人,動動嘴就能畫好一幅畫(精準點說是打打鍵盤)。這些生成式AI 猛然打入人們的生活。
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。
Thumbnail
去年阿財有分享過自動駕駛技術各個解決方案的路線選擇,當時我就有提到過我認為傳統車廠為什麼不走純視覺路線的可能原因,這邊再稍微分享一下: 首先在講純視覺之前先了解一下目前純視覺是如何計算深度的,目前用相機拍到的影像計算深度有單目視覺、雙目視覺、運動結構恢復(sfm)等再搭配AI模型,可以搜尋Pseud
Thumbnail
ChatGPT, 生成式AI 開場影片 今天用AI生成的素材,利用Clipchamp製作影片。 Clipchamp文字轉語音功能,非常適合不露臉及錄音的創作者使用。 使用Clipchamp編輯 故事開始 小熊發明 ChatGPT,大受歡迎。 人們問他股市何時回穩,他回答:「我不確定,但如果你問 Ch