左:因「漸凍人症」無法言語的霍金(來源:Wikipedia)。右:「鋼彈」世界中直接已經神感應溝通的新人類與強化人。(ⓒ富野由悠季/SUNRISE)
科學家已經可以直接把你的大腦訊號轉成整句的語音了!這可是物理學的大事!
2019年4月24日「Nature」刊登的論文「Speech synthesis from neural decoding of spoken sentences」(利用神經解碼技術對整句口語的語音合成),是由加州大學舊金山分校神經外科系的 Edward F. Chang 領導的研究團隊所發表。
研究團隊與腦袋裡已經為了治療癲癇而植入電極陣列的病人合作,讓他們講數以百計的句子,利用植入的電極紀錄腦部活動,將句子的內容、說這些句子時發音器官(舌頭、嘴唇、下顎等)的運動模式、以及對應的大腦電訊號的紀錄,作為遞迴神經網路(recurrent neural network)的訓練資料集,然後讓受試者在心中默唸句子,再將此時記錄到的腦波輸入訓練好的神經網路,神經網路的不是直接輸出句子,而是由腦訊號先轉成「發音器官的運動」,再以這些器官的動作模擬出合成語音。測試結果顯示,聽了101句由腦波直接轉譯的句子,測試者可以分辨出70%左右。
物理學家史蒂芬‧霍金,因罹患漸凍人症,做了氣切手術無法說話,所以得靠語音輔助系統與別人溝通,必須一個字母一個字母輸入,然後合成語音,這種方式講話超慢,大約每分鐘只能講十個字,本研究可以達到正常講話的速度,每分鐘約150個字。
過去類似的技術只能轉譯一個一個的單字,這次能夠說出整個句子,是技術上的一大突破。由於人工智慧輸出的不是變化繁複之極的人類語言,而是相對單純的發音運動,所以不需要太大的訓練資料集。
鋼彈世界裡面的兩大不可思議黑科技:「米諾夫斯基粒子」,與能夠讀取駕駛員腦波,並增幅直接操控機體的「精神感應框體Psycho Frame」,上回講了米諾夫斯基核融合爐(只是內容物不含米諾夫斯基粒子),今天的報導告訴我們,距離製造出 Psycho Frame 與「強化人間」的日子又接近了一步!
只是想起來有點恐怖的是,以前拷問俘虜的時候用的是嚴刑拷打與自白劑,有了這個技術,只要電極一接,腦袋裡想什麼就可以直接讀取,根本就是反烏托邦世界…
什麼?跟物理學無關?以電極讀取神經電訊號的神經電生理學、由發音器官運動模擬聲音的聲學,當然都是物理學啊!超有關的好不好!