一個小學生葉明,因為正義有為,救了同學卻是被雷劈中。意外獲得神奇系統,從此展開反轉人生,一路開掛的命運。
最後大家一起分工來處理,葉明因為本身經驗比較少,
所以負責開發自動辨識人的心情的部分。另外需要幫忙主核心。
隨然這一次合作的題目和方向跟原本葉明想的不一樣。
但是裡面的核心和軟體部分其實還是比較接近。
這一次葉明想説如何才可以在比賽中奪得冠軍?
這一次的國際創意軟體比賽,重點在於創意的部分,
需要從日常生活上面可以設計如何解決?
一般來說,聊天系統,最重要的第一步是語音辨識。現有的語音辨識都是採用使用前需要先訓練電腦可以熟悉你的語調和聲音。但是這種方式太慢也太差。
第二部分則是如何判斷對方的心情和講話的語調。
這部分是目前葉明負責的部分。
一般來說都是使用聲音的語調,講話的文字,和語句等來分析,
不過葉明覺得這樣的判斷正確率似乎不是很好。
如果可以再加上攝影機的方式,讓機器可以利用攝影方式看到講話著的表情。
這樣可以跟人類很像,可以從表情得部分來判斷。
這樣可以增加判斷人的心情的準確率。
不過葉明覺得應該還是不夠,因為還需要更有創意的部分。
首先如果機器想要達到真正的聊天的話,
就需要達到不需要訓練語音輸入的部分。
另外人的心情有時候並不是都可以都透過臉部的表情來看出來,
所以還需要有其他的輔助資料。
首先葉明先針對語音辨識的方式進行改善,
一開始葉明想要使用資料庫比對的方式。
也就是建立很多的資料庫之後利用數學模型的判斷來比對和進行語音辨識。
因為數學模型是完整推出來,葉明覺得應該效果不錯。
於是信心滿滿的葉明,想說直接找AI菁英社的社員來試看看。結果居然是大失所望。
將近有一半的社員辨識率只有55%,好一點也只提升到60%。
想要達到交談自如的地步似乎還要更多努力。
後來葉明開始尋找一些國外的論文和想法,因為這一個部分國內的方式就是比較落後。在國外已經很多新的方式。經過一個星期的尋找論文和方向。
最後葉明採用了一種深度學習的模式搭配自我擴充的神經系統和生成式學習。
簡單來說就仿照人類的思考模式,和大腦組成的神經元。
經過學習之後就可以進行實際與辨識。
一般論文使用方式都要預先決定你要使用多少層的類神經資源,
但是葉明的方式是根據運用發現不夠的時候自我擴充,
一方面可以滿足要求,又不會系統過於龐大。
另外葉明創造出進階改良式神經元模型,不但速度和效能是一般論文提出方式的10倍,
而且所需要的運算量還可以同時降低一倍。
此外葉明創做出來,自動訓練系統,
透過AI預先學一些語調、口語、腔調、不同區域的方言等自動產生各種測試和訓練的 pattern,可以達到自我訓練方式。
特別找了很多同學來進行錄音和測試。
果然之前不使用訓練方式的成功率只有30~40%,
使用訓練之後同樣的人可以達到85~90%。
但是不同人的話又掉到50~60%。
採用葉明的進階改良式深度學習和類神經學習,居然可以達到98.3~99.7%。
這一個關卡總算先克服了~
第二個部分,首先葉明依靠自己腦力開發頂尖,
想要找到一些規則或是架構可以來提高人的心情辨識。
但是似乎花了很多的力氣和時間,最後弄了兩個星期結果才改善15%左右。
這時候讓葉明有些沮喪,想說自己的腦部開發這麼厲害,結果還是不如預期。
這時候的葉明陷入了胡同,還沒有出來。
此時楊均同學看到葉明同學似乎悶悶不樂的樣子,就詢問葉明實際狀況如何?
葉明只好一五一十將實際的狀況跟楊均來說明。
楊均聽到之後,就跟葉明説,你的參考資訊不夠,
即使是真的人類也無法直接利用只有臉部資訊可以高準確度的判斷心情?
這時候楊均便說可以找首都醫院的資源來參考看看。
因為楊均的大哥就剛好在首都醫院當任院長。
可以過去首都醫院取得更多有關於病人相關資料可以來參考。
另外也找了一位首都醫院的教授,專門在研究有關於測謊機的部分,
進行特別指導一下。
漸漸的葉明知道原來人心情看分成外顯和內在。
外顯部分像是臉部的表情,手和腳的動作,眼睛的眼神等。
此外還有流汗和臉部顏色的也算是外顯。
內在的部分包含心跳的速度,呼吸快慢,血壓的高低,腦波的運作,血液裡面的腎上腺數濃度等。
但是想一想看總不能一堆檢測儀器都帶在身上才能進行心情辨識吧?
這樣子似乎也是不可以行?所以似乎需要選擇一些關鍵的部分來實際使用?
目前國內看起來無法做到這樣的設備。
這部分也讓葉明十分的困擾,他本身具有相關的創意和技術可以克服,
但是國內卻很難找到廠商可以來製作。
最後透過AI菁英社的社員認識到國外知名的廠商可以製作相關的設備,才解決了相關的問題。