Gemini Storybook：自動生成故事書指南【全面解析】

2025/08/08 更新2025/08/07 發佈閱讀 4 分鐘

Google旗下的Gemini再次推出創新功能，這次瞄準的是親子共讀、創意寫作與教育應用領域——AI 生成故事書（Storybook）。只需輸入一句簡單的描述，就能讓Gemini為你量身打造一本10頁的插畫故事書，並支援語音朗讀功能。這項技術不僅顛覆了傳統說故事的方式，也為家長、老師、創作者提供了前所未有的靈感來源。本文將全面介紹這項功能的使用方式、實際流程與潛在限制，幫助你快速上手並了解其最佳應用場景。

But！要事先提醒，目前故事書朗讀僅支援英文，如果想要中文朗讀，可以點擊了解 >>

什麼是Gemini Storybook功能？

Gemini是由 Google DeepMind 推出的多模態大型語言模型（LLM），融合文字、圖像與語音能力，可與ChatGPT等類工具相抗衡。

在2025年8月初，Google在Gemini 應用中推出了名為Storybook的新功能，讓使用者能以簡短描述或素材（如照片、手繪圖）生成10頁的插畫故事書，並包含語音朗讀。

怎樣用Gemini生成故事書？

第1步：打開Gemini應用或造訪網頁版，需登入你的Google帳號。此功能目前已全球開放，涵蓋桌面與行動裝置平台。

第2步：輸入你想要的故事內容，例如：「講一隻獨角獸在世界各地傳遞善良的故事」。

第3步：可選擇添加素材，上傳照片、孩子的畫作或PDF文件，讓Gemini擷取靈感以生成更具個人色彩的內容。

第4步：指定藝術風格，可選擇像是pixel art、漫畫風、黏土動畫、填色書風格等多種視覺樣式。

第5步：生成故事書，Gemini會快速在幾秒鐘或不到一分鐘內完成10頁的文字、插圖與語音朗讀內容，並讓你預覽、聆聽、下載或分享。

第6步：編輯、調整，若部分頁面的內容或畫風你不滿意，可透過後續對話提出修改要求，Gemini支援續對話式調整。

功能優勢與使用場景

親子共讀神器：特別適合家長在睡前講故事，或教師以圖文方式教導孩子概念（如分享、宇宙的運作等）。

高度個人化：能透過用戶提供的照片或繪畫創作出專屬故事，連同旅行記憶或家庭片段也能變成繪本。

多語支援：支援超過45種語言，適合全球多語系用戶使用。

功能局限與注意事項

當前這款故事書支援中文顯示，但語音朗讀功能僅限於英文。實際測試發現，使用英文作為提示詞效果最佳，特別是在設定每一頁內容時，若使用中文可能導致頁面順序錯亂或產生錯誤內容。

PS. 如果你想要更加客製化的朗讀聲音，可以透過這個網站來快速生成 >>

每次最多可生成10頁（包含封面），可透過連結分享給他人瀏覽，也提供列印為 PDF 的儲存選項。
插畫一致性不足：相同角色在不同頁面的服裝、樣貌可能出現差異，例如「奶奶」在幾頁穿著不同顏色的衣服。
畫面奇異或不符合預期：有次測試內容中出現像魚長人手、番茄醬看似犯罪現場、電視螢幕出現在角色後方等怪異視覺。
語音朗讀語言限制：雖支援多語言故事內容，但語音播放可能仍限有支援的語言。
屬實驗功能，表現尚在優化中：功能標註為「實驗性模組」，在穩定性與品質上仍有提升空間。

Gemini的Storybook功能是一項極具想像力與親子互動價值的新工具，只需一句話，就可生成包含插圖和語音的專屬故事書。它讓AI成為創作故事的夥伴，適合用於教育與娛樂。然而，目前在畫面一致性與藝術精準性方面以及聲音上仍有一些瑕疵，使用中可期待逐步改進。如果你還想用別的方式來生成更好聽、更詳細的故事書，不妨試試這個工具 >>

留言

留言分享你的想法！

Wesley的沙龍

0會員

10內容數

Wesley的沙龍的其他內容

2025/07/14

Google Veo 3生成影片教學&免費方案

Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。

2025/07/14

Google Veo 3生成影片教學&免費方案

Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。

2025/06/24

Midjourney V1影片生成模型評測：功能、優缺點與免費替代方案

2025年6月，Midjourney團隊正式發布其首款影片生成模型「Midjourney Video V1」，引起全球創作者圈與科技媒體的高度關注。該模型主打「一圖生成動畫」，運用AI插值技術與畫格合成邏輯，讓靜態影像搖身一變成為視覺流暢的短秒數影片。

2025/06/24

Midjourney V1影片生成模型評測：功能、優缺點與免費替代方案

2025/06/12

[2025最新]免費文字轉語音平臺：190+語言支援，打造自然好聽的語音內容

本文介紹TopMediai文字轉語音線上平臺，此平臺免費、操作簡單、支援多種語言和聲線，適用於自媒體創作者、行銷人員和教育工作者。文章詳細說明平臺亮點，包括支援多種語言和口音、語音自然度高、操作流程簡單，並提供操作教學。

2025/06/12

[2025最新]免費文字轉語音平臺：190+語言支援，打造自然好聽的語音內容

看更多

你可能也想看

鹿刻Luke

當平台訂閱取代電影票房，台灣影視產業如何打入國際市場、吸引全球觀眾

金馬獎呼喚大家走進戲院，但Youtube、Netflix已成日常。最新研究顯示，臺灣VOD訂閱戶破700萬，年產值近百億。在全球影視產業洗牌之際，臺灣如何運用國際資金與平臺，將在地故事推向世界？專家點出，理解演算法、克服盜版、制定對接國際的政策是關鍵。

#電影產業#全球在地化#串流平台

2025/11/26

鹿刻Luke

當平台訂閱取代電影票房，台灣影視產業如何打入國際市場、吸引全球觀眾

#電影產業#全球在地化#串流平台

2025/11/26

花神沒有咖啡館的沙龍

在VOD黃金時代打造「台流」——隨選串流服務與政策制度、消費行為和演算法的關係

使台劇得以突破過往印象中偶像劇、鄉土劇等範疇，產製更多類型，甚至紅到國外、帶動台灣觀光的最重要原因，便是「隨選串流平台」服務在近十年的蓬勃發展，台灣人愛看串流的程度或許比你我想像中都高，高到連美國電影協會（MPA），都委託Frontier Economics進行研究

#電影產業#全球在地化#串流平台

2025/11/24

花神沒有咖啡館的沙龍

在VOD黃金時代打造「台流」——隨選串流服務與政策制度、消費行為和演算法的關係

#電影產業#全球在地化#串流平台

2025/11/24

碎進時間的裂縫

獨立調香師用「一週八日」演繹未道出的內在流動｜來自台灣的 Sunkronizo

在喧囂的日常中，你是否尋找能代表內心狀態的氣味？臺灣獨立調香師品牌 Sunkronizo 的「一週八日」系列香水，演繹創作者孤獨、沉靜卻自由奔放的內在。其中「星期六 Silent Wild」以綠橄欖、茶香與白麝香交織出清新、寧靜且溫暖的氣息，連結自我與世界的流動，找回那份「只是在」的和諧。

#未道出的內在流動#獨立調香師#白麝香

2025/11/28

碎進時間的裂縫

獨立調香師用「一週八日」演繹未道出的內在流動｜來自台灣的 Sunkronizo

#未道出的內在流動#獨立調香師#白麝香

2025/11/28

林位青的沙龍

AI 繪本創作新工具，改變了我們與內容互動方式：Gemini Storybook

Gemini 推出 Storybook 功能，可根據提示詞生成圖文故事書，支援多種風格和語言，並可朗讀。此工具不僅能生成故事，代表 AI 應用更具個人化創作與參與式體驗。Storybook 可用於個人回憶創作、協助兒童理解複雜概念、親子共讀等。商業品牌亦可藉此進行品牌敘事式行銷，創造專屬故事。

#孩童#品牌#商業

2025/08/06

林位青的沙龍

AI 繪本創作新工具，改變了我們與內容互動方式：Gemini Storybook

#孩童#品牌#商業

2025/08/06

Hank吳的沙龍

Gemini 應用程式的個人化故事書創作：背後技術大解密

Google 的 Gemini 應用程式近期 (8/5號) 推出了一項引人入勝的新功能：「個人化插圖故事書」(Storybook, https://gemini.google.com/gem/storybook)，讓使用者能透過簡單的文字指令，在短短幾分鐘內生成一本圖文並茂、附有語音朗讀的 10 頁

#生成#應用程式#Google

2025/08/06