Gemini Storybook:自動生成故事書指南【全面解析】

更新 發佈閱讀 4 分鐘

Google旗下的Gemini再次推出創新功能,這次瞄準的是親子共讀、創意寫作與教育應用領域——AI 生成故事書(Storybook)。只需輸入一句簡單的描述,就能讓Gemini為你量身打造一本10頁的插畫故事書,並支援語音朗讀功能。這項技術不僅顛覆了傳統說故事的方式,也為家長、老師、創作者提供了前所未有的靈感來源。本文將全面介紹這項功能的使用方式、實際流程與潛在限制,幫助你快速上手並了解其最佳應用場景。

But!要事先提醒,目前故事書朗讀僅支援英文,如果想要中文朗讀,可以點擊了解 >>

什麼是Gemini Storybook功能?

Gemini是由 Google DeepMind 推出的多模態大型語言模型(LLM),融合文字、圖像與語音能力,可與ChatGPT等類工具相抗衡。

在2025年8月初,Google在Gemini 應用中推出了名為Storybook的新功能,讓使用者能以簡短描述或素材(如照片、手繪圖)生成10頁的插畫故事書,並包含語音朗讀。

怎樣用Gemini生成故事書?

第1步:打開Gemini應用或造訪網頁版,需登入你的Google帳號。此功能目前已全球開放,涵蓋桌面與行動裝置平台。

raw-image

第2步:輸入你想要的故事內容,例如:「講一隻獨角獸在世界各地傳遞善良的故事」。

raw-image

第3步:可選擇添加素材,上傳照片、孩子的畫作或PDF文件,讓Gemini擷取靈感以生成更具個人色彩的內容。

第4步:指定藝術風格,可選擇像是pixel art、漫畫風、黏土動畫、填色書風格等多種視覺樣式。

第5步:生成故事書,Gemini會快速在幾秒鐘或不到一分鐘內完成10頁的文字、插圖與語音朗讀內容,並讓你預覽、聆聽、下載或分享。

raw-image

第6步:編輯、調整,若部分頁面的內容或畫風你不滿意,可透過後續對話提出修改要求,Gemini支援續對話式調整。

功能優勢與使用場景

親子共讀神器:特別適合家長在睡前講故事,或教師以圖文方式教導孩子概念(如分享、宇宙的運作等)。

高度個人化:能透過用戶提供的照片或繪畫創作出專屬故事,連同旅行記憶或家庭片段也能變成繪本。

多語支援:支援超過45種語言,適合全球多語系用戶使用。

功能局限與注意事項

  1. 當前這款故事書支援中文顯示,但語音朗讀功能僅限於英文。實際測試發現,使用英文作為提示詞效果最佳,特別是在設定每一頁內容時,若使用中文可能導致頁面順序錯亂或產生錯誤內容

PS. 如果你想要更加客製化的朗讀聲音,可以透過這個網站來快速生成 >>

  1. 每次最多可生成10頁(包含封面),可透過連結分享給他人瀏覽,也提供列印為 PDF 的儲存選項。
  2. 插畫一致性不足:相同角色在不同頁面的服裝、樣貌可能出現差異,例如「奶奶」在幾頁穿著不同顏色的衣服。
  3. 畫面奇異或不符合預期:有次測試內容中出現像魚長人手、番茄醬看似犯罪現場、電視螢幕出現在角色後方等怪異視覺。
  4. 語音朗讀語言限制:雖支援多語言故事內容,但語音播放可能仍限有支援的語言。
  5. 屬實驗功能,表現尚在優化中:功能標註為「實驗性模組」,在穩定性與品質上仍有提升空間。

Gemini的Storybook功能是一項極具想像力與親子互動價值的新工具,只需一句話,就可生成包含插圖和語音的專屬故事書。它讓AI成為創作故事的夥伴,適合用於教育與娛樂。然而,目前在畫面一致性與藝術精準性方面以及聲音上仍有一些瑕疵,使用中可期待逐步改進。如果你還想用別的方式來生成更好聽、更詳細的故事書,不妨試試這個工具 >>

留言
avatar-img
留言分享你的想法!
avatar-img
Wesley的沙龍
0會員
10內容數
Wesley的沙龍的其他內容
2025/07/14
Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。
Thumbnail
2025/07/14
Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。
Thumbnail
2025/06/24
2025年6月,Midjourney團隊正式發布其首款影片生成模型「Midjourney Video V1」,引起全球創作者圈與科技媒體的高度關注。該模型主打「一圖生成動畫」,運用AI插值技術與畫格合成邏輯,讓靜態影像搖身一變成為視覺流暢的短秒數影片。
Thumbnail
2025/06/24
2025年6月,Midjourney團隊正式發布其首款影片生成模型「Midjourney Video V1」,引起全球創作者圈與科技媒體的高度關注。該模型主打「一圖生成動畫」,運用AI插值技術與畫格合成邏輯,讓靜態影像搖身一變成為視覺流暢的短秒數影片。
Thumbnail
2025/06/12
本文介紹TopMediai文字轉語音線上平臺,此平臺免費、操作簡單、支援多種語言和聲線,適用於自媒體創作者、行銷人員和教育工作者。文章詳細說明平臺亮點,包括支援多種語言和口音、語音自然度高、操作流程簡單,並提供操作教學。
Thumbnail
2025/06/12
本文介紹TopMediai文字轉語音線上平臺,此平臺免費、操作簡單、支援多種語言和聲線,適用於自媒體創作者、行銷人員和教育工作者。文章詳細說明平臺亮點,包括支援多種語言和口音、語音自然度高、操作流程簡單,並提供操作教學。
Thumbnail
看更多
你可能也想看
Thumbnail
金馬獎呼喚大家走進戲院,但Youtube、Netflix已成日常。最新研究顯示,臺灣VOD訂閱戶破700萬,年產值近百億。在全球影視產業洗牌之際,臺灣如何運用國際資金與平臺,將在地故事推向世界?專家點出,理解演算法、克服盜版、制定對接國際的政策是關鍵。
Thumbnail
金馬獎呼喚大家走進戲院,但Youtube、Netflix已成日常。最新研究顯示,臺灣VOD訂閱戶破700萬,年產值近百億。在全球影視產業洗牌之際,臺灣如何運用國際資金與平臺,將在地故事推向世界?專家點出,理解演算法、克服盜版、制定對接國際的政策是關鍵。
Thumbnail
使台劇得以突破過往印象中偶像劇、鄉土劇等範疇,產製更多類型,甚至紅到國外、帶動台灣觀光的最重要原因,便是「隨選串流平台」服務在近十年的蓬勃發展,台灣人愛看串流的程度或許比你我想像中都高,高到連美國電影協會(MPA),都委託Frontier Economics進行研究
Thumbnail
使台劇得以突破過往印象中偶像劇、鄉土劇等範疇,產製更多類型,甚至紅到國外、帶動台灣觀光的最重要原因,便是「隨選串流平台」服務在近十年的蓬勃發展,台灣人愛看串流的程度或許比你我想像中都高,高到連美國電影協會(MPA),都委託Frontier Economics進行研究
Thumbnail
在喧囂的日常中,你是否尋找能代表內心狀態的氣味?臺灣獨立調香師品牌 Sunkronizo 的「一週八日」系列香水,演繹創作者孤獨、沉靜卻自由奔放的內在。其中「星期六 Silent Wild」以綠橄欖、茶香與白麝香交織出清新、寧靜且溫暖的氣息,連結自我與世界的流動,找回那份「只是在」的和諧。
Thumbnail
在喧囂的日常中,你是否尋找能代表內心狀態的氣味?臺灣獨立調香師品牌 Sunkronizo 的「一週八日」系列香水,演繹創作者孤獨、沉靜卻自由奔放的內在。其中「星期六 Silent Wild」以綠橄欖、茶香與白麝香交織出清新、寧靜且溫暖的氣息,連結自我與世界的流動,找回那份「只是在」的和諧。
Thumbnail
Gemini 推出 Storybook 功能,可根據提示詞生成圖文故事書,支援多種風格和語言,並可朗讀。此工具不僅能生成故事,代表 AI 應用更具個人化創作與參與式體驗。Storybook 可用於個人回憶創作、協助兒童理解複雜概念、親子共讀等。商業品牌亦可藉此進行品牌敘事式行銷,創造專屬故事。
Thumbnail
Gemini 推出 Storybook 功能,可根據提示詞生成圖文故事書,支援多種風格和語言,並可朗讀。此工具不僅能生成故事,代表 AI 應用更具個人化創作與參與式體驗。Storybook 可用於個人回憶創作、協助兒童理解複雜概念、親子共讀等。商業品牌亦可藉此進行品牌敘事式行銷,創造專屬故事。
Thumbnail
Google 的 Gemini 應用程式近期 (8/5號) 推出了一項引人入勝的新功能:「個人化插圖故事書」(Storybook, https://gemini.google.com/gem/storybook),讓使用者能透過簡單的文字指令,在短短幾分鐘內生成一本圖文並茂、附有語音朗讀的 10 頁
Thumbnail
Google 的 Gemini 應用程式近期 (8/5號) 推出了一項引人入勝的新功能:「個人化插圖故事書」(Storybook, https://gemini.google.com/gem/storybook),讓使用者能透過簡單的文字指令,在短短幾分鐘內生成一本圖文並茂、附有語音朗讀的 10 頁
Thumbnail
Gemini Storybook 功能,讓使用者能透過文字、圖片或檔案,創作 10 頁的個人化有聲繪本。支援超過 45 種語言,並提供多種繪圖風格選擇,包含像素風、漫畫、黏土動畫等。此功能適用於教育、家庭共創及語言學習等情境,可幫助孩子理解複雜概念、珍藏回憶或提升學習動機。
Thumbnail
Gemini Storybook 功能,讓使用者能透過文字、圖片或檔案,創作 10 頁的個人化有聲繪本。支援超過 45 種語言,並提供多種繪圖風格選擇,包含像素風、漫畫、黏土動畫等。此功能適用於教育、家庭共創及語言學習等情境,可幫助孩子理解複雜概念、珍藏回憶或提升學習動機。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
這篇文章介紹了如何利用ChatGPT在偏鄉教育中提升教學效率。我們利用ChatGPT從繁雜的簡報中提取重點,創作適合小朋友的故事和教案。孩子們通過互動和說故事技巧,學會導覽景點,了解社區歷史和傳說。AI輔助讓教學準備事半功倍,提供更多創意和互動機會,提升了孩子們的學習興趣和表達能力。
Thumbnail
這篇文章介紹了如何利用ChatGPT在偏鄉教育中提升教學效率。我們利用ChatGPT從繁雜的簡報中提取重點,創作適合小朋友的故事和教案。孩子們通過互動和說故事技巧,學會導覽景點,了解社區歷史和傳說。AI輔助讓教學準備事半功倍,提供更多創意和互動機會,提升了孩子們的學習興趣和表達能力。
Thumbnail
NotebookLM 是一款人工智慧筆記本工具,利用 Gemini 1.5 Pro 模型分析資料,幫助使用者輕鬆地彙整內容,包括教學研究、訪談逐字稿、文件、網頁和其他資料。AI 會自動整理所有資料並生成摘要。並提供解答或協助完成相關任務。
Thumbnail
NotebookLM 是一款人工智慧筆記本工具,利用 Gemini 1.5 Pro 模型分析資料,幫助使用者輕鬆地彙整內容,包括教學研究、訪談逐字稿、文件、網頁和其他資料。AI 會自動整理所有資料並生成摘要。並提供解答或協助完成相關任務。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
回應格友小日光的問題,如何將史蒂芬·金的八本小說書名做為關鍵字,輸出成五佰字的短文。 這次使用的是Google的ai :「gemini」 ~~~ 給ai 「gemini」的條件: 給我500字左右的創作短文,而且一定要有以下的關鍵字:《四季奇譚》、 《戰憟遊戲》、《勿忘我》、《黑暗之半》、《
Thumbnail
回應格友小日光的問題,如何將史蒂芬·金的八本小說書名做為關鍵字,輸出成五佰字的短文。 這次使用的是Google的ai :「gemini」 ~~~ 給ai 「gemini」的條件: 給我500字左右的創作短文,而且一定要有以下的關鍵字:《四季奇譚》、 《戰憟遊戲》、《勿忘我》、《黑暗之半》、《
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News