20251027 08:00 全文完

前言:世間之道無他,耐煩二字而已 By【不知雪の蟬】
這次「中美晶」法說會逐字稿整理,可真讓團隊裡的「虎鯨」,實實在在體驗了座頭鯨「吞不下,吐出來」的苦頭啊!
蛙註:沒關係,咱就知道科普很重要,「老肉雜談」別搞成「老菜咱談」,對那隻蟬而言,什麼是齒鯨/鬚鯨有點難,只要不跟讀者說,竹筍長在竹子樹上,那就阿彌陀佛了……
決定逐字稿整體精確度,經常就是那「關鍵的5%」
別以為整理「逐字稿」這麼簡單,AI 的平均辨識精確度,最多只能達到 85-86% 的水準;Google聲稱語音辨識人工智慧(AI)技術,正確率可高達9成5以上,仍與人類的精確度相去甚遠。
根據我慘痛的經驗,整理「準確度95%」的語音逐字稿,整體所耗費的時間,幾乎跟邊聽音檔邊打字一樣久。
這也難怪,坊間逐字稿沒人敢挑戰完整逐字稿,通常是摘要式的,也就是省略跳過AI無法辨識的部分……
如果,剛好省略的部分就是企業競爭的關鍵呢?
差點改到懷疑人生了~以下是《虎鯨》令人同情的慘痛經驗
報告蟬大,開頭總經理公司的簡介,可謂「鉅細彌遺、毫無重點」,非常多地方就是「聽君一席話,如聽一席話」,AI都覺得見鬼了、一路鬼打牆,連聲音轉文字的AI智能系統,可能真的聽不太懂他在說什麼,哈,猶如德國式中文加菲律賓式英文,一開始的AI逐字稿檔案,缺字的情形非常嚴重,滿罕見的,都得逐字核對。
好吧!世間之道無他,耐煩二字而已~重新用iPhone再側錄一套完整的影片,再拿去AI轉成文字出來核對……
原來,中文真的很難,AI不會就是不會:快哭了,總經理在影片講的是中文,逐字稿寫的是中文,我的鍵盤也是中文,卻是三個「平行時空」中文,周朝、漢朝、唐朝……
常常看完一段AI逐字稿,卻完全看不懂在說什麼,得反覆看好幾次,重聽推敲前後文,設身處地了解電腦在想什麼,深深感慨中文之博大精深。
其難度,不下我阿嬤參加全民英檢……

資料整理:【虎鯨】&【Jenna】















