Google旗下的Gemini再次推出創新功能,這次瞄準的是親子共讀、創意寫作與教育應用領域——AI 生成故事書(Storybook)。只需輸入一句簡單的描述,就能讓Gemini為你量身打造一本10頁的插畫故事書,並支援語音朗讀功能。這項技術不僅顛覆了傳統說故事的方式,也為家長、老師、創作者提供了前所未有的靈感來源。本文將全面介紹這項功能的使用方式、實際流程與潛在限制,幫助你快速上手並了解其最佳應用場景。
But!要事先提醒,目前故事書朗讀僅支援英文,如果想要中文朗讀,可以點擊了解 >>
什麼是Gemini Storybook功能?
Gemini是由 Google DeepMind 推出的多模態大型語言模型(LLM),融合文字、圖像與語音能力,可與ChatGPT等類工具相抗衡。
在2025年8月初,Google在Gemini 應用中推出了名為Storybook的新功能,讓使用者能以簡短描述或素材(如照片、手繪圖)生成10頁的插畫故事書,並包含語音朗讀。
怎樣用Gemini生成故事書?
第1步:打開Gemini應用或造訪網頁版,需登入你的Google帳號。此功能目前已全球開放,涵蓋桌面與行動裝置平台。

第2步:輸入你想要的故事內容,例如:「講一隻獨角獸在世界各地傳遞善良的故事」。

第3步:可選擇添加素材,上傳照片、孩子的畫作或PDF文件,讓Gemini擷取靈感以生成更具個人色彩的內容。
第4步:指定藝術風格,可選擇像是pixel art、漫畫風、黏土動畫、填色書風格等多種視覺樣式。
第5步:生成故事書,Gemini會快速在幾秒鐘或不到一分鐘內完成10頁的文字、插圖與語音朗讀內容,並讓你預覽、聆聽、下載或分享。

第6步:編輯、調整,若部分頁面的內容或畫風你不滿意,可透過後續對話提出修改要求,Gemini支援續對話式調整。
功能優勢與使用場景
親子共讀神器:特別適合家長在睡前講故事,或教師以圖文方式教導孩子概念(如分享、宇宙的運作等)。
高度個人化:能透過用戶提供的照片或繪畫創作出專屬故事,連同旅行記憶或家庭片段也能變成繪本。
多語支援:支援超過45種語言,適合全球多語系用戶使用。
功能局限與注意事項
- 當前這款故事書支援中文顯示,但語音朗讀功能僅限於英文。實際測試發現,使用英文作為提示詞效果最佳,特別是在設定每一頁內容時,若使用中文可能導致頁面順序錯亂或產生錯誤內容。
PS. 如果你想要更加客製化的朗讀聲音,可以透過這個網站來快速生成 >>
- 每次最多可生成10頁(包含封面),可透過連結分享給他人瀏覽,也提供列印為 PDF 的儲存選項。
- 插畫一致性不足:相同角色在不同頁面的服裝、樣貌可能出現差異,例如「奶奶」在幾頁穿著不同顏色的衣服。
- 畫面奇異或不符合預期:有次測試內容中出現像魚長人手、番茄醬看似犯罪現場、電視螢幕出現在角色後方等怪異視覺。
- 語音朗讀語言限制:雖支援多語言故事內容,但語音播放可能仍限有支援的語言。
- 屬實驗功能,表現尚在優化中:功能標註為「實驗性模組」,在穩定性與品質上仍有提升空間。
Gemini的Storybook功能是一項極具想像力與親子互動價值的新工具,只需一句話,就可生成包含插圖和語音的專屬故事書。它讓AI成為創作故事的夥伴,適合用於教育與娛樂。然而,目前在畫面一致性與藝術精準性方面以及聲音上仍有一些瑕疵,使用中可期待逐步改進。如果你還想用別的方式來生成更好聽、更詳細的故事書,不妨試試這個工具 >>


























