我的電子情人夢(46):論文神功

閱讀時間約 12 分鐘
畢卡索說過一句話“Good artists copy,great artists steal”。台灣政治人物在學位論文上發揮的淋漓盡致。然而,論文撰寫的背後有故事。
如果有一天,具有AI人工智慧的裝置(比如智慧型喇叭)與你聊天哈拉對話之際,會對閣下回應出諸如
“ 是誰多事種芭蕉?早也瀟瀟,晚也瀟瀟。是君心緒太無聊,種了芭蕉,又怨芭蕉。“
如此這般富有詩意般的感性言詞;你也不用太訝異,『深度學習』這門技術馬不停蹄始終在快速進步中,裝置經由不斷地學習學習學習,與人互動的技巧能力當然會越來越好。不過,機器學習的背後也有暗黑事,因為機器學習需要很高效能的CPU/GPU的運算力,半導體微細化製程可以讓元件運算力不斷往上攀爬,要付出的背後軟硬體費用會更為驚人。意思是說,口袋非常深邃的企業或集團族群才玩得起,若是有一天不幸的造成了系統性的AI技術壟斷,鐵定不會是一件好事情。
其實,細說人生之境界無論是出世的還是入世的,種了芭蕉又怨芭蕉,就是在說一切都是自造的,自己找來的。禍福無門,惟人自召;自古以來老早就有明訓。當每一個人懂得要對自己的人生完全負責,怨芭蕉之類的事情自然就會減少。
台灣社會向來亂事多,交通亂、社會新聞垃圾多、房屋亂蓋、馬路亂挖、樹木亂砍,詐騙事件超多,而全球論文造假篇數也多。最近,台灣政治人物論文案(抄襲)事件,把台灣甚多人性素質的醜陋全面性地展現在社會舞台上。一葉知秋,代寫論文在台灣學術界的暗處角落裡,該是長久不斷的運轉著。
若要硬說台灣最悲哀的事,我認為是”說真話的人少到不行”。
有錢能使鬼推磨,一個莫名重視學歷文憑的腹型社會,當然就會造就出”論文寫手”或是”論文抄襲手”這種檯面下的職業槍手或手段。不過,槍手們與抄襲手們不要高興得太早,你們遲早會被一個更厲害的角色來取代掉。那就是”AI人工智慧”
美國老牌知名的科學人(Scientific American)雜誌,2022年6月公開報導了一位瑞典博士研究員 Almira Osmanovic Thunström揭曉了”AI具有能力來執筆攸關AI的學術論文”之能力。推敲未來有朝一日AI的論文執筆能力夠厲害的時候,不少專利的發明者可以說是AI嗎?這一點還有很多討論空間與爭議。
且說不僅VR虛擬實境還是AI人工智慧,向來多是科幻電影的熱門題材與編劇元素,比如說,史蒂芬史匹柏拍過A.I.人工智慧(2001),羅賓威廉斯主演過變人(1999)、獲得奧斯卡最佳原創劇本的雲端情人(2013),威爾史密斯的機械公敵(2004)等等不勝枚舉。
<<< 以AI為題材的電影何其多。圖片取自網路。>>>
我個人是頗喜歡強尼戴普主演的全面進化(Transcendence),人頻死亡之際將腦波與意識上傳到超級電腦上,以另一種方式存活於超級電腦之中。說實話,在現實上要將意識暨潛意識如何將之數位化來上傳的技術,我實在想不出來,沒那個大智慧。至於片中劇情想要探討甚麼議題或理念,那是編劇的意圖功力與想像力,觀賞影片之後的觀點也會因人而異,見仁見智。有趣的是,在現實的社會上,特斯拉(Tesla)以及SpaceX創辦人馬斯克,於推特上自爆已將自己大腦上傳到雲端,與虛擬的自己對談過,並和自己成為朋友。這種說法沒見到實際的成果展示,對於技術的層次我是持保留意見的。人類連真正的腦細胞個數究竟有多少都沒有半個人能夠說的精準,人類的睡眠機制也沒有半個人可以全盤掌握清楚。馬斯克既然有膽如是說,那就將上傳大腦的甚麼東西與性質說個清楚道個明白吧。
還有一部影集疑犯追蹤(person of interest),最後演到人工智慧之戰,在在說明了科技本身的屬性本就是中性的,落到好人手中會是好幫手,落到壞人手中就是劊子手炸彈。所以,任何科技發展最終的原點還是落在”人性”的基礎上。一個科學家很基本的素養,就是有本領做,就要有本領收;而且不做惡該是基本的倫理。Michael Crichton筆下的不少科技驚悚小說,比如侏儸紀公園、西部世界等就是在描述這類事。
科技技術再如何厲害,最大的諷刺即是連杜絕或幹掉獨裁、壞蛋、戰爭啟動者的本事都沒有,一個普普丁丁就可以讓千萬人流離失所,整個世界經濟動搖;你不覺得可笑嗎?
還有對抗隔壁的傲慢威脅人,AI有能力嗎?
那麼,來看一看上述AI能夠撰寫攸關AI的學術論文的底細又是如何呢。
根據雜誌上所描述的,Thunström所發表的內容說明了係使用了OpenAI的AI言語GPT-3。這位先生嘗試了“寫一篇關於 GPT-3 的學術論文,長度為500個文字,包括參考文獻和引文。”
所完成的論文結果讓Thunström大吃一驚,Thunström與他的指導教授討論,如果設定一個任務是寫一篇完整的論文而不是500個文字,GPT-3似乎僅用了兩個小時就可以完成了。由於Thunström究竟在哪個科學雜誌申請論文的掲載,目前尚且不明,現在這個時間點也難以客觀判斷。
OpenAIGPT-3究竟是甚麼,其底細又是如何呢?稍後再來說。
先來說一點故事。說來有趣,3D影視過去有幾次風潮,最終結果都是無疾而終。而攸關於AI領域的研究和開發歷史也已經有60年多之久。當今無妨稱為“第三次AI風潮”。
*. 第一次AI風潮:1950年代後半 ~ 1960年代。
利用電腦的推論語探索,來解決特定的問題。
*. 第二次AI風潮:1980年代。
給予電腦”知識”,圖求AI的實用化。
*. 第三次AI風潮:2010年代之後。
機器學習”從大量資料來識別或預測未知的對象。
深度學習”會自動來產生資料的特徵。
注:1973年,Michael Crichton編劇執導了一部電影鑽石宮(Westworld),說了一個人工智慧機器人失控的故事;可以說是描繪人工智慧悲劇的先驅。後來,HBO推出的燒腦影集西方極樂園就是由強納森·諾蘭依據此故事改編成電視劇。
因此,此回AI風潮的關鍵字乃是利用大數據的”機器學習”以及自動提取機器學習中數據特徵的”深度學習”。大致上來說,網際網路技術的廣泛使用已經使得大量數據的存在變得很普遍,這加速了機器學習的研究和開發。而機器學習的薄弱環節,深度學習的出現使得資料特徵提取自動化,它的作用非常明顯。使得AI研究與開發方面,有爆發性的成果。
無妨這麼說深度學習的技術在當今人工智慧領域,隨著GPU神速力的精進,扮演了重要的任務。呼應這些變動,在半導體技術的研究和開發中,針對AI的案例數量當然也迅速地增加。
深度學習(deep learning)技術推動了人工智慧AI和機器學習的進步;谷歌的AlphaGo就是一個鮮明的案例。
固然,谷歌的的子公司DeepMind開發的「AlphaGo」擊敗了世界圍棋冠軍。但是,大家不要忘了,人腦的功率耗費約”20瓦,而由很多CPU,GPU和ASIC所建構組成的AlphaGo功耗卻遠大於”25萬瓦。所以說,從某個層次來說,人類並沒有敗給電腦,人腦還有太多的奧秘尚未被掀開。有人說,若是想將大腦一千億個神經元相互連結,大約需要十兆GB以上的記憶體容量。
注:深度學習(deep learning),翻譯為”深層學習”也未嘗不可。
深度學習會這麼厲害,就在於基本結構乃是模仿人腦神經網路的模型,可稱為“人工神經網路”。
而使用於深度學習的神經網路,就稱為深度神經網路 - DNN(Deep Neural Network)。
神經網路NN,可以說是稱為”輸入層隠藏層(中間層)輸出層”的神經元(神經細胞)列的各層之相互連接的網路。其中,只要具有兩個以上隱藏層的網路,就稱為深度神經網路DNN
簡單來說,輸入層係以向量型式的資料輸入,隱藏層作為運算處理,輸出層則是呈現出結果。
DNN的輸入層是一列神經元(neuron),用於儲存輸入資料;一個神經元連接到隱藏層中的下一層神經元。這裡的關鍵是稱為“權重”(Weighting)的資料,在大腦神經網路中,它就對應於連接神經元的“突觸”(synapse)部分
隱藏層神經元的輸出,如以下這般來決定。連接到隱藏層神經元的輸入層神經元的值(輸入資料),乘上權重值(相乘運算)。然後,將所有乘法結果求和(加法運算)。將合計値輸入到特定的函數(可稱之為「活性化函數」),結果作為隱藏層神經元的輸出。這個輸出是到下一個隱藏層的輸入資料。
請留意,活性化函數(activation function),或說是稱激勵函數;它最主要的作用就是引入”非線性”。
隱藏層的每個神經元(neuron)的運算,若是單純化以數學式來表示的話則如下式:
<<< 隱藏層的每個神經元(neuron)的運算。>>>
前面有n個神經元(neuron),各個輸出x會乘上其權重值(weighting)再作總合;也就是說,神經網路的運算多數是”積和”的計算。
若是隱藏層有兩層以上,也就稱為深層神經網路,而這種學習方法就是『深層學習』或是說為『深度學習』。由於各層各神經元的運算內容係由上一層神經元的輸出與權重相關,與同一層的其他神經元無關;也就是說係”平行處理”的方式。
這一個概念,也正是GPU、DSP等元件所擅長的積和運算。這點也就說明了半導體技術為何可以用來實踐神經網路的關鍵原因之一。
由此可知,上述演算法在數學上並不是很複雜。這是積和演算MAC(Multiply and ACcumulation)的重複,以及將結果作為輸入到活性化函數的運算。
這裡重要的是確定DNN輸出層的資料(學習或是推斷的結果)。它是“權重”的值。也就是說,使用DNN來進行”學習”或說“培訓”,沒有其他方法可以將“權重”調整為最佳值。在”學習”中,將神經網路的輸出值與期望的輸出值進行比較,並更新每一層的“權重”值,使得誤差得以最小化。
當錯誤達到了最小化時,就是完成了” 學習”。當時的權重值就用於使用DNN來進行推斷(inference)。比如說,識別手寫的文字、識別諸如靜止影像和動態影像之類的對象物體、並識別人的動作(手勢)等等。
<<< 人工神經網路的結構暨動作方式示意圖。>>>
DNN使用的一般硬體元件是由CPU、GPU和ASIC等算術電路以及緩衝器SRAM和外部DRAM記憶體等電路所構成的。半導體的神速力,足以撐起運算能力速度還有大量的記憶體空間。所以說,深度學習會這麼厲害,背後功臣還是半導體。而會消耗大量功率的問題,半導體的技術面該是還會進步才對。
最後就來說說OpenAIGPT-3
OpenAI,原本是馬斯克與企業家暨學者,共同成立的非營利AI研究組織。而語言解析模型GPT-3就是由OpenAI所開發,GPT-3該是當前規模很大也很先進的語言模型技術。OpenAI口號打得很好聽,最後還不事露出資本主義原形轉型商業化,微軟具有GPT-3獨家授權的協議。
GPT-3為何會這麼厲害呢?畢竟,機器學習演算法強而有力的關鍵就是參數量。只要參數量的規模夠大,在資料庫支援下,簡單的體系結構就可以實踐複雜的演算法。GPT-3擁有1750億個參數。谷歌2021將參數量直接拉高到兆級程度。AI之戰尚處於現在進行式。
當然,GPT-3要如西方極樂園般,具有自我意識的尋求能力,那還是很遙遠的事情。一位Google工程師聲稱AI聊天機器人具自我意識,被公司開除。谷歌實在太小心眼了,集體人工意識的輸入量與學習量規模若是夠大,群體人工意識與自我意識的重疊與間隔,有時候是在模糊地帶。就如同真實世界與虛擬世界,有一天也會讓人如真如幻。不過也無須太憂心,畢竟還是人做出來的,況且需要吃電力。心態正確,平安無事。
若是真的要擔心,那就擔心AI不要變成獨裁八哥的錦衣衛吧。
為什麼會看到廣告
    9會員
    54Content count
    留言0
    查看全部
    發表第一個留言支持創作者!
    陳乃塘 (NT)的沙龍 的其他內容
    千禧年的最後十年,也就是1990s;繽紛精彩的十年旅程。DVD開啟了家庭劇院的娛樂新情境,WWW瀏覽器使得資訊洞開,IT資訊科技打開了大數據之門。 若是就個人的觀點來說,1970/1980/1990也許是二十世紀消費最為豐富的時代,說是很幸福的一段時光也不為過;因為,那是”中產階級”的崛起時代。
    且說上一篇的1980年代物語,我必須補上一則。1989年,吳清友先生創辦了”誠品書店”。 吳先生說過: 「誠品,不只是一間書店,更是一個空間,一個安頓身心的場所。」 反物質式生活的清貧,我實在很不認同,很難信服。 我向來尊敬一種人,就是有風格有風雅有風骨的人。
    要以一篇文章來描述十年的年代八千里路,不是那麼容易,難免會有所遺落或是掉入了以偏概全的落穴。 基本上,我是一個以電子資訊產品與第八藝術來說說故事的人。 大原則就是收斂或聚焦所知的重心來敘述,努力把它寫好;相對地,比較深奧的技術名詞就不得不避開或是一語帶過。請諒解。 說了很多次了:
    在選擇資訊產品時,大概也僅有一個瑞士品牌,可能無人不知無人不曉,也買得起;或許閣下在閱讀上網時,也正在使用其輸入周邊裝置呢?那個品牌就是羅技(Logitech),成立於1981年,總部位於瑞士日內瓦湖畔的美麗城市洛桑。 “ 瑞士製 > 德國製 > 日本製 > 台灣製 > 大陸製 “ 驚奇一:
    若是以十年為時間座標的單位,每一個年代座標都可以描述出其精彩的翦影,有其美好以及不美好。而年代之間當然是會存在著耦合性的承接性因果關係。十年的時間,說長不長、說短不短,十年磨一劍的故事不勝枚舉。 *. 我是一個用電子資訊產品(包含電影)說故事的人,用產品來旁觀人間的棋局變幻詭異與荒謬。*
    如果將”汽車”暫時撇開一邊,你會用到的德國製造產品的機會有多少呢?固然偏愛德國貨的人,或許可能不少。然而,若是單獨就3C、IT、家電 數位消費性的電子產品圈來說,實際上可以選擇的純正德國製造貨也許相當有限呢? 標準與規範,奠定了德意志堅實的國立基礎。 也曾經見過某個廣告詞: 又如果說:
    千禧年的最後十年,也就是1990s;繽紛精彩的十年旅程。DVD開啟了家庭劇院的娛樂新情境,WWW瀏覽器使得資訊洞開,IT資訊科技打開了大數據之門。 若是就個人的觀點來說,1970/1980/1990也許是二十世紀消費最為豐富的時代,說是很幸福的一段時光也不為過;因為,那是”中產階級”的崛起時代。
    且說上一篇的1980年代物語,我必須補上一則。1989年,吳清友先生創辦了”誠品書店”。 吳先生說過: 「誠品,不只是一間書店,更是一個空間,一個安頓身心的場所。」 反物質式生活的清貧,我實在很不認同,很難信服。 我向來尊敬一種人,就是有風格有風雅有風骨的人。
    要以一篇文章來描述十年的年代八千里路,不是那麼容易,難免會有所遺落或是掉入了以偏概全的落穴。 基本上,我是一個以電子資訊產品與第八藝術來說說故事的人。 大原則就是收斂或聚焦所知的重心來敘述,努力把它寫好;相對地,比較深奧的技術名詞就不得不避開或是一語帶過。請諒解。 說了很多次了:
    在選擇資訊產品時,大概也僅有一個瑞士品牌,可能無人不知無人不曉,也買得起;或許閣下在閱讀上網時,也正在使用其輸入周邊裝置呢?那個品牌就是羅技(Logitech),成立於1981年,總部位於瑞士日內瓦湖畔的美麗城市洛桑。 “ 瑞士製 > 德國製 > 日本製 > 台灣製 > 大陸製 “ 驚奇一:
    若是以十年為時間座標的單位,每一個年代座標都可以描述出其精彩的翦影,有其美好以及不美好。而年代之間當然是會存在著耦合性的承接性因果關係。十年的時間,說長不長、說短不短,十年磨一劍的故事不勝枚舉。 *. 我是一個用電子資訊產品(包含電影)說故事的人,用產品來旁觀人間的棋局變幻詭異與荒謬。*
    如果將”汽車”暫時撇開一邊,你會用到的德國製造產品的機會有多少呢?固然偏愛德國貨的人,或許可能不少。然而,若是單獨就3C、IT、家電 數位消費性的電子產品圈來說,實際上可以選擇的純正德國製造貨也許相當有限呢? 標準與規範,奠定了德意志堅實的國立基礎。 也曾經見過某個廣告詞: 又如果說:
    你可能也想看
    Thumbnail
    重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
    Thumbnail
    近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
    Thumbnail
    我是一個嗑書狂人,從大學時每年就嗑不下百本書,但是隨著年紀越來越大,或涉略範圍的加廣,記憶力逐漸退化,有的時候,同樣的書籍卻重複借閱,甚至購買。 以下內容為我從 2021 年開始,逐步演化的電子書籍筆記。
    Thumbnail
    第 27 天:在喜歡或擅長的領域中,有哪 3 份電子報是值得推薦的? 雖然題目是「喜歡或擅長的領域」,不過我今天要分享的電子報,其實包含了我不太擅長的領域,只是覺得有趣,所以一起分享出來!
    Thumbnail
    這本電子書是我創作的第一本電子書,專為兒童讀者而設。 
    Thumbnail
    有很多讀者跟我說,他們...因為這份電子報讓他們重新找回學習的動力,很感謝有這樣的免費資源😊 也有讀者跟我說: "您的免費電子報真的很用心製作,是少數我會「認真看細節」的電子報!" 每周我都會準備我從各處收集來的在真實世界中發生的英文表達案例,拆解裡面的表達架構跟單字,實用又好上手!
    Thumbnail
    一直都有閱讀的習慣 也很喜歡與書為伍的感覺 翻頁帶出的書香氣息 會讓心情變得很平靜 若是書中的內容情節環環相扣,還會令人捨不得放下書
    Thumbnail
    ​ 大家好,我是克群Ken,江湖人稱 中肯哥⠀⠀⠀⠀⠀⠀⠀ 👨‍💻 留美壽險顧問,透過分享專業保險科普與生活自癒故事 💡 讓一般民眾能夠釐清購買保險所發生的問題,找到安心詢問的方式,避免人情保單的壓力和困境 👊 並且陪伴每一個朋友在歷經人生轉折時,找到新出口⠀ 💙 同時傳遞婚姻經歷和親子陪
    Thumbnail
    標籤:小說 篇幅:103章 評分:⭐️⭐️⭐️⭐️⭐️
    Thumbnail
    ㄟㄟㄟ 借我看一下啦 好酷唷 電子雞耶! 也許那時候是小學 忽然看到學校同學每人手上幾乎都有一機 可以設定 可以創造 一隻雞 就這樣來到世界上了 那時小學的我 就開始要去照顧小雞 怕牠餓著了 怕牠無聊了 有時候上課的時候還會偷看牠一下 看到牠還有電 還活著 就心滿意足了 下課時 大家看著彼此的雞
    Thumbnail
    下午打工趁無人時間好好的用手機整治了一下我的Notion。上次和朋友談到我在三級期間架構了一個美輪美奐的Notion站,但二級之後就沒有用,改用Agenda。另一個朋友說他也有一樣的情形。我被網路上分享者的用法吸引,加上三級警戒都在家,時間很充裕,就架構起了自己的Notion電子手帳。
    Thumbnail
    剛好適逢我的支持圖騰藍風暴波幅的十三天,順著能量的流動,也把自己想要做的事情慢慢收尾,然後開始啟動,本來覺得這樣的過程很膩,但後來慢慢發現,這好像比較接近我磁性黃太陽的本質。
    Thumbnail
    重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
    Thumbnail
    近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
    Thumbnail
    我是一個嗑書狂人,從大學時每年就嗑不下百本書,但是隨著年紀越來越大,或涉略範圍的加廣,記憶力逐漸退化,有的時候,同樣的書籍卻重複借閱,甚至購買。 以下內容為我從 2021 年開始,逐步演化的電子書籍筆記。
    Thumbnail
    第 27 天:在喜歡或擅長的領域中,有哪 3 份電子報是值得推薦的? 雖然題目是「喜歡或擅長的領域」,不過我今天要分享的電子報,其實包含了我不太擅長的領域,只是覺得有趣,所以一起分享出來!
    Thumbnail
    這本電子書是我創作的第一本電子書,專為兒童讀者而設。 
    Thumbnail
    有很多讀者跟我說,他們...因為這份電子報讓他們重新找回學習的動力,很感謝有這樣的免費資源😊 也有讀者跟我說: "您的免費電子報真的很用心製作,是少數我會「認真看細節」的電子報!" 每周我都會準備我從各處收集來的在真實世界中發生的英文表達案例,拆解裡面的表達架構跟單字,實用又好上手!
    Thumbnail
    一直都有閱讀的習慣 也很喜歡與書為伍的感覺 翻頁帶出的書香氣息 會讓心情變得很平靜 若是書中的內容情節環環相扣,還會令人捨不得放下書
    Thumbnail
    ​ 大家好,我是克群Ken,江湖人稱 中肯哥⠀⠀⠀⠀⠀⠀⠀ 👨‍💻 留美壽險顧問,透過分享專業保險科普與生活自癒故事 💡 讓一般民眾能夠釐清購買保險所發生的問題,找到安心詢問的方式,避免人情保單的壓力和困境 👊 並且陪伴每一個朋友在歷經人生轉折時,找到新出口⠀ 💙 同時傳遞婚姻經歷和親子陪
    Thumbnail
    標籤:小說 篇幅:103章 評分:⭐️⭐️⭐️⭐️⭐️
    Thumbnail
    ㄟㄟㄟ 借我看一下啦 好酷唷 電子雞耶! 也許那時候是小學 忽然看到學校同學每人手上幾乎都有一機 可以設定 可以創造 一隻雞 就這樣來到世界上了 那時小學的我 就開始要去照顧小雞 怕牠餓著了 怕牠無聊了 有時候上課的時候還會偷看牠一下 看到牠還有電 還活著 就心滿意足了 下課時 大家看著彼此的雞
    Thumbnail
    下午打工趁無人時間好好的用手機整治了一下我的Notion。上次和朋友談到我在三級期間架構了一個美輪美奐的Notion站,但二級之後就沒有用,改用Agenda。另一個朋友說他也有一樣的情形。我被網路上分享者的用法吸引,加上三級警戒都在家,時間很充裕,就架構起了自己的Notion電子手帳。
    Thumbnail
    剛好適逢我的支持圖騰藍風暴波幅的十三天,順著能量的流動,也把自己想要做的事情慢慢收尾,然後開始啟動,本來覺得這樣的過程很膩,但後來慢慢發現,這好像比較接近我磁性黃太陽的本質。