Gemini Storybook:自動生成故事書指南【全面解析】

更新 發佈閱讀 4 分鐘

Google旗下的Gemini再次推出創新功能,這次瞄準的是親子共讀、創意寫作與教育應用領域——AI 生成故事書(Storybook)。只需輸入一句簡單的描述,就能讓Gemini為你量身打造一本10頁的插畫故事書,並支援語音朗讀功能。這項技術不僅顛覆了傳統說故事的方式,也為家長、老師、創作者提供了前所未有的靈感來源。本文將全面介紹這項功能的使用方式、實際流程與潛在限制,幫助你快速上手並了解其最佳應用場景。

But!要事先提醒,目前故事書朗讀僅支援英文,如果想要中文朗讀,可以點擊了解 >>

什麼是Gemini Storybook功能?

Gemini是由 Google DeepMind 推出的多模態大型語言模型(LLM),融合文字、圖像與語音能力,可與ChatGPT等類工具相抗衡。

在2025年8月初,Google在Gemini 應用中推出了名為Storybook的新功能,讓使用者能以簡短描述或素材(如照片、手繪圖)生成10頁的插畫故事書,並包含語音朗讀。

怎樣用Gemini生成故事書?

第1步:打開Gemini應用或造訪網頁版,需登入你的Google帳號。此功能目前已全球開放,涵蓋桌面與行動裝置平台。

raw-image

第2步:輸入你想要的故事內容,例如:「講一隻獨角獸在世界各地傳遞善良的故事」。

raw-image

第3步:可選擇添加素材,上傳照片、孩子的畫作或PDF文件,讓Gemini擷取靈感以生成更具個人色彩的內容。

第4步:指定藝術風格,可選擇像是pixel art、漫畫風、黏土動畫、填色書風格等多種視覺樣式。

第5步:生成故事書,Gemini會快速在幾秒鐘或不到一分鐘內完成10頁的文字、插圖與語音朗讀內容,並讓你預覽、聆聽、下載或分享。

raw-image

第6步:編輯、調整,若部分頁面的內容或畫風你不滿意,可透過後續對話提出修改要求,Gemini支援續對話式調整。

功能優勢與使用場景

親子共讀神器:特別適合家長在睡前講故事,或教師以圖文方式教導孩子概念(如分享、宇宙的運作等)。

高度個人化:能透過用戶提供的照片或繪畫創作出專屬故事,連同旅行記憶或家庭片段也能變成繪本。

多語支援:支援超過45種語言,適合全球多語系用戶使用。

功能局限與注意事項

  1. 當前這款故事書支援中文顯示,但語音朗讀功能僅限於英文。實際測試發現,使用英文作為提示詞效果最佳,特別是在設定每一頁內容時,若使用中文可能導致頁面順序錯亂或產生錯誤內容

PS. 如果你想要更加客製化的朗讀聲音,可以透過這個網站來快速生成 >>

  1. 每次最多可生成10頁(包含封面),可透過連結分享給他人瀏覽,也提供列印為 PDF 的儲存選項。
  2. 插畫一致性不足:相同角色在不同頁面的服裝、樣貌可能出現差異,例如「奶奶」在幾頁穿著不同顏色的衣服。
  3. 畫面奇異或不符合預期:有次測試內容中出現像魚長人手、番茄醬看似犯罪現場、電視螢幕出現在角色後方等怪異視覺。
  4. 語音朗讀語言限制:雖支援多語言故事內容,但語音播放可能仍限有支援的語言。
  5. 屬實驗功能,表現尚在優化中:功能標註為「實驗性模組」,在穩定性與品質上仍有提升空間。

Gemini的Storybook功能是一項極具想像力與親子互動價值的新工具,只需一句話,就可生成包含插圖和語音的專屬故事書。它讓AI成為創作故事的夥伴,適合用於教育與娛樂。然而,目前在畫面一致性與藝術精準性方面以及聲音上仍有一些瑕疵,使用中可期待逐步改進。如果你還想用別的方式來生成更好聽、更詳細的故事書,不妨試試這個工具 >>

留言
avatar-img
Wesley的沙龍
1會員
10內容數
Wesley的沙龍的其他內容
2025/07/14
Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。
Thumbnail
2025/07/14
Google Veo 3是Google DeepMind團隊於2025年推出的最新一代文字轉影片生成模型。本文詳解Veo3的使用步驟并提供免費方案給您參考。
Thumbnail
2025/06/24
2025年6月,Midjourney團隊正式發布其首款影片生成模型「Midjourney Video V1」,引起全球創作者圈與科技媒體的高度關注。該模型主打「一圖生成動畫」,運用AI插值技術與畫格合成邏輯,讓靜態影像搖身一變成為視覺流暢的短秒數影片。
Thumbnail
2025/06/24
2025年6月,Midjourney團隊正式發布其首款影片生成模型「Midjourney Video V1」,引起全球創作者圈與科技媒體的高度關注。該模型主打「一圖生成動畫」,運用AI插值技術與畫格合成邏輯,讓靜態影像搖身一變成為視覺流暢的短秒數影片。
Thumbnail
2025/06/12
本文介紹TopMediai文字轉語音線上平臺,此平臺免費、操作簡單、支援多種語言和聲線,適用於自媒體創作者、行銷人員和教育工作者。文章詳細說明平臺亮點,包括支援多種語言和口音、語音自然度高、操作流程簡單,並提供操作教學。
Thumbnail
2025/06/12
本文介紹TopMediai文字轉語音線上平臺,此平臺免費、操作簡單、支援多種語言和聲線,適用於自媒體創作者、行銷人員和教育工作者。文章詳細說明平臺亮點,包括支援多種語言和口音、語音自然度高、操作流程簡單,並提供操作教學。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
Gemini 推出 Storybook 功能,可根據提示詞生成圖文故事書,支援多種風格和語言,並可朗讀。此工具不僅能生成故事,代表 AI 應用更具個人化創作與參與式體驗。Storybook 可用於個人回憶創作、協助兒童理解複雜概念、親子共讀等。商業品牌亦可藉此進行品牌敘事式行銷,創造專屬故事。
Thumbnail
Gemini 推出 Storybook 功能,可根據提示詞生成圖文故事書,支援多種風格和語言,並可朗讀。此工具不僅能生成故事,代表 AI 應用更具個人化創作與參與式體驗。Storybook 可用於個人回憶創作、協助兒童理解複雜概念、親子共讀等。商業品牌亦可藉此進行品牌敘事式行銷,創造專屬故事。
Thumbnail
Google 的 Gemini 應用程式近期 (8/5號) 推出了一項引人入勝的新功能:「個人化插圖故事書」(Storybook, https://gemini.google.com/gem/storybook),讓使用者能透過簡單的文字指令,在短短幾分鐘內生成一本圖文並茂、附有語音朗讀的 10 頁
Thumbnail
Google 的 Gemini 應用程式近期 (8/5號) 推出了一項引人入勝的新功能:「個人化插圖故事書」(Storybook, https://gemini.google.com/gem/storybook),讓使用者能透過簡單的文字指令,在短短幾分鐘內生成一本圖文並茂、附有語音朗讀的 10 頁
Thumbnail
Gemini Storybook 功能,讓使用者能透過文字、圖片或檔案,創作 10 頁的個人化有聲繪本。支援超過 45 種語言,並提供多種繪圖風格選擇,包含像素風、漫畫、黏土動畫等。此功能適用於教育、家庭共創及語言學習等情境,可幫助孩子理解複雜概念、珍藏回憶或提升學習動機。
Thumbnail
Gemini Storybook 功能,讓使用者能透過文字、圖片或檔案,創作 10 頁的個人化有聲繪本。支援超過 45 種語言,並提供多種繪圖風格選擇,包含像素風、漫畫、黏土動畫等。此功能適用於教育、家庭共創及語言學習等情境,可幫助孩子理解複雜概念、珍藏回憶或提升學習動機。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力: 回答如下:
Thumbnail
這篇文章介紹了如何利用ChatGPT在偏鄉教育中提升教學效率。我們利用ChatGPT從繁雜的簡報中提取重點,創作適合小朋友的故事和教案。孩子們通過互動和說故事技巧,學會導覽景點,了解社區歷史和傳說。AI輔助讓教學準備事半功倍,提供更多創意和互動機會,提升了孩子們的學習興趣和表達能力。
Thumbnail
這篇文章介紹了如何利用ChatGPT在偏鄉教育中提升教學效率。我們利用ChatGPT從繁雜的簡報中提取重點,創作適合小朋友的故事和教案。孩子們通過互動和說故事技巧,學會導覽景點,了解社區歷史和傳說。AI輔助讓教學準備事半功倍,提供更多創意和互動機會,提升了孩子們的學習興趣和表達能力。
Thumbnail
NotebookLM 是一款人工智慧筆記本工具,利用 Gemini 1.5 Pro 模型分析資料,幫助使用者輕鬆地彙整內容,包括教學研究、訪談逐字稿、文件、網頁和其他資料。AI 會自動整理所有資料並生成摘要。並提供解答或協助完成相關任務。
Thumbnail
NotebookLM 是一款人工智慧筆記本工具,利用 Gemini 1.5 Pro 模型分析資料,幫助使用者輕鬆地彙整內容,包括教學研究、訪談逐字稿、文件、網頁和其他資料。AI 會自動整理所有資料並生成摘要。並提供解答或協助完成相關任務。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
回應格友小日光的問題,如何將史蒂芬·金的八本小說書名做為關鍵字,輸出成五佰字的短文。 這次使用的是Google的ai :「gemini」 ~~~ 給ai 「gemini」的條件: 給我500字左右的創作短文,而且一定要有以下的關鍵字:《四季奇譚》、 《戰憟遊戲》、《勿忘我》、《黑暗之半》、《
Thumbnail
回應格友小日光的問題,如何將史蒂芬·金的八本小說書名做為關鍵字,輸出成五佰字的短文。 這次使用的是Google的ai :「gemini」 ~~~ 給ai 「gemini」的條件: 給我500字左右的創作短文,而且一定要有以下的關鍵字:《四季奇譚》、 《戰憟遊戲》、《勿忘我》、《黑暗之半》、《
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News