在10月29日的午間直播中,我分享了一個觀點:在我們這個時代,面對AI,個體層次的工作者應該先回頭「解構」自己的工作流程(workflow)。我們要做的,是找出流程中關鍵的「工作節點」(work nodes),並定義出每一個節點的「規格」(specifications)。
想清楚這點之後,我們再回頭檢視,看看現有的生成式AI工具,到底能幫我們到什麼程度?又能幫到多深?
這支影片,是我給大一管理學學生的其中一週「補課」內容。我就想以這個熱騰騰的「產出」為具體範例,跟大家拆解,為了完成這份教材,我的工作流發生了什麼變化?以及我具體用上了哪些生成式AI來輔助。步驟一:教材製作 — 打造專屬的「課程專家GEM」
首先,是教材的製作。我建立了一個專門的GEM,也就是一個客製化的AI模型。這個GEM,是專門為了我這門《管理學》課程量身打造的。
我把這門課所有的「規格」都預先設定給它了。這就像是為一個新來的助教進行「職前訓練」,我把know-how都灌給它:
- 風格規格: 我希望的網頁視覺風格、需要具備的互動功能(例如筆記、匯出功能)、以及整體的語氣。
- 知識規格: 這門課所需要的所有管理學專業知識點,我都預先處理成Markdown格式餵給它。這包含了《新經營學》這本書的關鍵摘要,以及其他補充理論。
- 個案規格: 貫穿我們整個學期的核心個案——日劇《陸王》——我把每一集的劇情概要、關鍵轉折點、和我想引導學生思考的討論點,也都放進去了。
- 進度規格: 每一週的教學進度與具體要求,它都一清二楚。
這等於是建立了一個專屬於這門課的「專家系統」。
所以,當我要準備新一週的內容時,我不需要從零開始。我只需要下達一個總指令,例如:「請依據W9的進度,本週主題是行銷溝通,請融合《陸王》第6集劇情,生成一份包含4P、5A模型、關鍵指標(如CTR, ROAS)的互動式網頁教材,並設計一個工作坊練習。」
然後,生成式AI就能依據我預設的完整規格與資料庫,產出這份高度客製化、且完全符合我教學設計的網頁講義。
步驟二:講學內容 — AI基於「自身產出」的再創造
接著,是講學內容的生成。這一步非常關鍵,展現了AI工作流的「連續性」。
因為上一步產出的網頁本身,就已經是一個「完整的教學架構」和「討論流程」(就像各位現在看到的),我不需要再另外構思。
我直接讓同一支GEM,基於「它自己剛剛生成的那份網頁」,幫我產出一份完整的「英文版口說講稿」。
而且,我還會加入特定的「教學提示」(prompts),我會告訴它:「你現在是一個經驗豐富的管理學教授,在講解4P時,請模擬學生可能會混淆STP與4P的錯誤觀念;在講解5A時,請模擬學生會把『按讚數』(Likes)當成『擁護』(Advocate)的常見錯誤,並在講稿中設計橋段來澄清這些觀念。」
於是,我就得到了各位在上一支影片聽到的那份英文講稿。
步驟三:聲音克隆與合成 — 解決教學者的「痛點」
第三步,是聲音的克隆與合成。
這一步的動機,來自於我個人的「痛點」。因為長期講課,我的聲帶經常處於緊繃或不適的狀態。要我再花一兩個小時,去錄製一份逐字稿的補課影片,對聲帶是很大的負擔。
所以,我利用了像是「TopMediai」這類可以克隆聲音的AI工具,來「代」我發聲。
我的工作流是:
- 把GEM生成的英文講稿餵給聲音克隆工具。
- 它會用「我的聲音」把稿子唸出來。
- 接著,我需要花一些時間去「校正」。例如,調整某些句子的語氣、關鍵字的停頓,以及修正一些專有名詞(像是 "Kohazeya" 或 "ROAS")的發音。
最終輸出的結果,大概有八到九分像我本人。
最後一步,就是「合成」:我開著螢幕錄影(Screen Recording),在背景播放這段克隆好的聲音,而我本人,則專注於配合聲音的節奏,捲動網頁、點擊互動元素、展示教材的重點,最終完成這支補課影片。
好,流程拆解完了。這就是這支影片的誕生過程。
大家一定會問我:「你這樣繞一圈處理,真的有比較快嗎?」
▮ 反思一:工作基準的轉移
這個問題非常棒,但答案是:很難直接比較,因為工作的「基準」(baseline)根本不同了。
如果我的教學目標,只是要做一份「靜態的PowerPoint簡報」,那我手動做,肯定還是比較快的。
但是,我對這份教材的要求,是產出一個(指著網頁)「帶有雙語切換、互動決策卡、可匯出學習成果的教學網頁」。如果要我手動去刻程式碼、去設計這整個互動流程,那所花費的時間將是AI的幾十倍,甚至我根本做不到。
所以,當我的教學要求從「單向講授」(簡報)升級為「互動體驗」(網頁)時,AI的介入,才讓這件事的邊際成本低到「可行」。
相較於過去我準備簡報內容、可能還要額外準備實體教具,現在用AI生成這份高品質網頁,兩者所花費的「總時間」或許差不多,但AI方案的可複製性與可延展性(scalability)是傳統方式無法比擬的。
▮ 反思二:錄製效率的比較
那,「用AI克隆聲音」跟「自己親口錄音」,哪個省時?
這也難說。以我的經驗,如果我親自錄音,我要一邊講、一邊操作網頁,很容易吃螺絲、講錯話、或者點錯地方,導致我必須不斷「中斷重錄」。這個「失誤重錄」的時間成本其實非常高。
而使用AI克隆聲音,雖然我必須花時間去校稿、去修正AI的語氣和錯誤發音,但這個「糾錯」的過程,是可控的、可分割的。我個人的體感是,修正AI的錯誤,還是比修正我自己的口誤來得有效率。
▮ 反思三:AI作為「教學鷹架」的價值
但坦白說,這整個流程中,對我個人衝擊最大、收穫也最大的,其實是「口說稿」本身。
我必須承認,過去十幾年的教學生涯,我從來沒有為了一堂課,去寫過「細部」的逐字講稿。我都是準備一個教學流程、幾個關鍵知識點,然後看著簡報或寫著板書,就開始「free style」講課、帶討論了。
但是,生成式AI產出的那份講稿(就像各位聽到的英文版),是「相當精緻且流暢的」,它甚至幫我設計了我想都沒想過的、承上啟下的轉折語,以及如何點出學生的「常見錯誤」。
這份產出物的品質,遠高於我即興發揮的平均水準。
所以,就算我最後決定不用AI配音,光是拿著這份AI生成的講稿,無論是我自己親自錄製,或甚至是我帶入實體課堂教學,它都是一份極佳的「教學鷹架」(Scaffolding)。它確保了我的教學邏輯嚴謹、表達流暢,這對教學品質的提升,價值非常高。
從「磨死老師」到「重塑歷程」
這整個過程,在我摸熟工具之後,其實並不複雜。
一旦流程順了,我就可以在很短的時間內,快速產出高品質的「數位教學資產」(Digital Assets),從而將我個人最寶貴的精力,真正釋放出來,放在「課堂的引導」與「和學生的深度互動」上。
這讓我回想起十幾年前,整個高等教育圈都在高喊「磨課師」(MOOCs)和「翻轉教育」是教學的未來。
但喊了這麼久,為什麼始終沒有成為主流?
我的答案很簡單:因為「未來未到,老師已經先被磨死了」。
一套高品質線上課程的開發、拍攝、剪輯、後製,所需要的製作成本與時間精力實在太高了。如果這個「門檻」高到只有少數人做得到,那它就不可能普及,永遠都只是教學的「輔助」,而不是主流。
而現在,生成式AI正在從根本上,徹底解決這個「高成本」的問題。
它在教育領域的顛覆性已無庸置疑。未來,教師的角色,必然會從「知識的唯一傳遞者」,轉變為「數個生成式AI工具的總指揮」,或者說,一個「學習體驗的設計師」。
我們將運用這些強大的工具,去真正重塑學生的學習歷程。

















