作者:陳華夫
據英國《金融時報》2022/7/29日的報導,
谷歌 (Google)的
DeepMind 公司發展的
深度學習 軟體─
AlphaFold 構建了迄今最完整、最準確的數據庫,其中包含逾2億種已知蛋白質。已經超越科學知識的極限,預測出幾乎所有已知蛋白質的形狀。這項突破將顯著加快生物學發現的步伐。它的CEO德米斯•哈薩比斯表示:「我們可以開始考慮端到端的藥物設計。那將是我的夢想,在開發新藥和治療方法時,你可以加快整個過程,而不僅是結構部分的工作。這一天即將到來。」也就是可以展開癌症、病毒類感染,抗生素、靶向藥、新效率的酶等藥物研發。(見
DeepMind宣布可預測幾乎所有蛋白質結構 )
但是情況有了革命性的轉變;2017年
谷歌 (Google)的
DeepMind 公司在權威的《
自然 》期刊是發表了
強化學習 史上劃時代的論文:「Mastering the game of go without human knowledge,David Silver, .et.al, Nature, 550, 354-359, 2017」(中文翻譯:不需要人類圍棋經驗練的超級電腦圍棋軟體),而這個超級電腦圍棋軟體就是舉世聞名的
AlphaGo Zero 。
底下的文章解釋什麼是
強化學習 及比較其與人類學習的優劣:
1) 強化學習 的架構及方法:
強化學習 的學習模型是先假設一系列學習狀態:St,St+1,St+2....,然後,再建立一個
策略函數π(a) ,以規範各個動作a1,a2,a3,是如何把各種狀態變成下一個狀態及分別得到獎勵:Rt,Rt+1,Rt+2....,而把任何一狀態St,經過
策略函數π(a) ,學習到終點所得到的總獎勵定義為:
價值函數 Vπ(s) = Rt + Rt+1+ ....然後不斷的改善π0(a),π1(a),π2(a),...,及Vπ0(s),Vπ1(s),Vπ2(s)....,直到
學習 出最佳的
策略函數π*(a) 及最佳的
價值函數 V*(s) ,如下圖。基本上,
強化學習 的
學習 就是想法寫出
深度學習 的
演算法 電腦程式,以求出最佳的
策略函數π*(a) 及最佳的
價值函數 V*(s) 。(見
強化學習教程 )
(圖:「強化學習式」思考的架構,圖片來源:陳華夫製作)
至於人工智能的下一步會如何發展?
商湯科技 的創始人、CEO徐立的演講中有一段發人深省的話:「人類過往科研創新的範式,從最早經驗歸納的範式,到演繹推理的範式,被稱為是第一、第二範式。經驗歸納從培根開始,講了用資料做歸納。當有了電腦之後,比如模擬類比就是電腦在做推理演繹,比如大資料,第四範式大資料科學可以對應到經驗的歸納。這樣的範式在過往很長時間當中把創新的模式總結到這個框架當中。(見
商湯科技徐立:人工智慧的下一步 )
根據斯坦福大學最新的人工智慧指數,2021年全球對人工智慧的私人投資同比增長了逾一倍,達到935億美元。自2015年以來,人工智慧的專利數量增加至30倍。雖然大宗商品、食品和能源價格一直以來都在飆升,但在過去五年里,一個機械臂的中位價格下降了46.2%。但人工智慧AI產業化轉型面臨著私營和公共部門之間知識和權力的日益失衡,而私營企業自然會優先考慮財務回報,而不是更廣泛的社會公益。(見
人工智慧產業化的希望與風險共存 )
2022/5/29日英國《金融時報》的
為什麼你的公司裡找不到人工智慧? 說:「雖然雲平台現在廣泛可用,但要想利用其潛力,還需要有精通雲計算的大學和組織。最後,組織需要特定的數據來賦予它們競爭優勢。數據可以來自內部,這意味著組織必須收集和處理數據;也可以來自外部,這種情況下,數據必須要超越基本交易數據才能發揮作用。僅憑上述的這些能力是不夠的。人工智慧的進步需要有競爭力的集群。雖然已經實現了知識全球化,但創新仍是地方性的。如果不能更好地理解這一切因素,越來越多的企業將被人工智慧革命甩在後面。」