淺談生成式AI與大語言模型的憂慮與困境

更新於 2023/07/15發佈於 2023/07/14閱讀時間約 4 分鐘

AI浪潮

自從去年ChatGPT後，AI這個本來沉寂已久的話題，瞬間火爆全世界，不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型，包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等，抑或是開始推出自己的生成式AI工具等等，例如Google的Bard、百度的文言一心、Open AI的DALL-E等等，但其中最多人用的還是ChatGPT，而微軟串接Open AI的Bing和Office365，也讓其聲勢大漲，可說是百家追逐、百家爭鳴，都在搶佔AI的高地。

而不只這些，就連AI相關的硬體都跟著聲勢大漲，包括負責生產AI用伺服器的廠商，緯創與相關個股，都紛紛衝的老高，而NVIDIA在其中更是一躍成為全球最炙手可熱的企業，雖然本來就很強了，但現在氣勢更是如日中天。

一個類似人，但又比人更快的服務，是人類追逐的目標，更不用說是它不會累，比起電影、漫畫和卡通裡的未來，彷彿又更近一步了，而且是大大的一步。

不過，在這些的背後，難道AI就沒有挑戰、困難、困境的地方嗎?

有，而且非常的多。

倫理

不光是倫理的問題了，這個是長久以來的問題，在1942年時，美國科幻小說作家艾薩克·艾西莫夫就在其小說轉圈圈其中一個篇章"我,機器人"中，就提出了著名的機器人三原則，其意就在保護人類。

因為一個成熟的AI，比起人類真是完美太多了，如果又讓其掌握了情緒等，那些人類才有的感情，加上又沒有條件去限制AI，那麼等待人類的，那可能不是像駭客任務中，那種人類被奴役的未來，那很大一部分就是被機器人、被AI清空的狀況。

在今年四月初，那些包含馬斯克的大老，就聯手數名一封名為"暫停大型人工智慧實驗"的公開信，想讓大家在現在瘋狂的AI競賽中緩一緩，可見也預期到了擔憂的未來。

同時有些回覆缺乏常識推理和理解，模型往往缺乏對世界知識的深入理解，容易在理解和回答複雜問題時出現錯誤或無法給出準確的答案。

訓練

在前文中提到，各家都在瘋狂的訓練自己的大語言模型，而在這次的AI競賽中，大語言模型(large language model，LLM)，本身就是個重中之重的重點，目前看到的諸多生成式AI應用，大語言模型在其中功不可沒，所謂的大語言模型，就是指1000B以上參數的語言模型，透過大量的自監督學習或半監督學習對大量未標記文本進行訓練，讓其資料庫中有更多"有意義"的文本，加上反覆的訓練、微調，讓其更接近一個人類。

但要訓練一個大語言模型，可非是簡單的事情，像是176B的Bloom，當初可是花了法國用超級電腦訓練了100多天才完成，而超級電腦這種東西，可不是簡單就能造出的，尤其各國在超級電腦的競賽，早就是非常熱烈的事情，每年超級電腦的排名都在變化，而且非常花錢，比如目前台灣最強的超級電腦，就是在2018時所打造的"台灣杉二號"，花了50億的經費和諸多人力，還包含很多科技、電信大廠投入，上面用了9,072個CPU和插了2,016張NVIDIA Tesla V100，目前NVIDIA Tesla V100一張在PChome賣299,000。

而且有了超級電腦，要訓練一個大語言模型，除了要時間運行外，也需要AI工程師對其訓練的模型進行調教、調整、接受user的反饋，來來回回進行調整，才可以產出"還算勘用"的大語言模型，耗錢、耗時、耗力，非一般單位可以去承受這些。

資料的偏見、隱私與安全

生成式AI可能會受到訓練數據中存在的偏見和不平等的影響。如果訓練數據中存在性別、種族、社會偏見等問題，生成的結果可能會反映這些偏見，進而加劇社會不平等。解決這個問題需要注意數據採集和清洗過程中的公正性，並進行後續的審查和調整，所以像是ChatGPT在訓練的過程中，就透過大量的人力進行貼標，以確保一些非常識或有違倫理的回覆出現。

同時生成式AI需要大量的數據來進行訓練，就算是以大語言模型的基底，那仍然是不足的，比如Bloom，在其中中文的語料就佔的非常少的比例，需要額外添加與再訓練，而在蒐集資料的過程中，就可能蒐集到隱密的資料，這可能涉及到用戶的個人信息和敏感數據。確保數據的隱私和安全性是一個重要的挑戰，需要採取適當的數據保護措施和隱私政策來保護用戶的權益。

不只這些

除了上述的挑戰外，還有很多諸如法律、倫理、版權等等一系列問題。例如，如何處理由AI生成的內容的版權問題?如何確保AI系統的公正性和透明性，以及如何在AI生成內容的過程中遵守隱私法規等等。這些問題需要進行廣泛的討論和製定相關政策來解決。

這些困境，都非一朝一夕能夠處理，除了大量人力時間討論外，還需要針對所處國家不同的人情、法律等作調整，在AI越來越方便的趨勢下，可見未來中，人類的生產力會有質的飛越，可產生的問題也越發明顯，需要眾人的努力去調整、制定。

Domo沙龍-那些雜七雜八的文章匯集處Domo的日常隨筆

留言

留言分享你的想法！

Domo沙龍-那些雜七雜八的文章匯集處

27會員

141內容數

Domo的沙龍，各種文章的匯集地日常、評論、政治、趨勢、時事、職場、工作、創作、小說等。都是我寫作的內容! 歡迎加入，Domo的沙龍

Domo沙龍-那些雜七雜八的文章匯集處的其他內容

2025/01/12

[重要]多益考前建議!

在2025的開頭兩個週日，我分別去考了多益口說和多益聽力和閱讀，於是想說趁著記憶猶新，來寫一下考前建議!

2025/01/12

[重要]多益考前建議!

在2025的開頭兩個週日，我分別去考了多益口說和多益聽力和閱讀，於是想說趁著記憶猶新，來寫一下考前建議!

2024/12/31

每一年都像一趟新的旅行，都要朝著光前進!

今年快結束了，按慣例，是該來寫一下今年的年度總結

2024/12/31

每一年都像一趟新的旅行，都要朝著光前進!

今年快結束了，按慣例，是該來寫一下今年的年度總結

2024/11/18

漢堡與飢餓行銷

飢餓行銷雖然可恥，但很有用

2024/11/18

飢餓行銷雖然可恥，但很有用

你可能也想看

ChatGPT於2022年底問世後，人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型，簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後，當一個人無法駕馭一個LLM時，被淘汰的變成是LLM而非這個人了。⋯

2023/09/23

2023/09/23

AI浪潮自從去年ChatGPT後，AI這個本來沉寂已久的話題，瞬間火爆全世界，不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型，包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等，抑或是開始推出自己的生成式AI工具等等，例如Google的Bard、百

2023/07/14

2023/07/14

AI 憑什麼這麼強 (二)：未來兩個方向的改進，讓 AI 變更強大

正文1,724字，主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點，知道數據跟 AI (或機器學習模型) 表現間的關係；了解 ChatGPT 為什麼有運算資源的困擾；同時，你也會看到目前最新改善 AI 運算速度的技術發表。

#數據#模型#ChatGPT

2023/06/12

Darren的沙龍

AI 憑什麼這麼強 (二)：未來兩個方向的改進，讓 AI 變更強大

#數據#模型#ChatGPT

2023/06/12

于正龍（Ricky）的沙龍

大型語言模型(LLM)的非常通俗易懂的介紹

[進行中未完成] 1.簡介本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統（如GPT-3、GPT-4、Bing Chat、Bard等）有一些了解。 ChatGPT是一種聊天機器人，是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生，但此文將一一解釋這些概念。

#人工智能#數據#模型

2023/05/18

于正龍（Ricky）的沙龍

大型語言模型(LLM)的非常通俗易懂的介紹

#人工智能#數據#模型

2023/05/18

Darren的沙龍

AI 憑什麼這麼強 (一)：人工智能模型的湧現現象

本文回答幾個問題：(一) 什麼叫做湧現；(二)湧現是什麼現象；(三)為什麼我們造不出自己的超級 AI。看完後，你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞，像是參數、大型機構與他們模型的名字。

#ChatGPT#人工智慧#人工智能

2023/05/16

Darren的沙龍

AI 憑什麼這麼強 (一)：人工智能模型的湧現現象

#ChatGPT#人工智慧#人工智能

2023/05/16

少鋒的沙龍

《瘋ChatGPT》人工智慧時代最大的挑戰不是技術，而是人類自己

距離ChatGPT上線也快四個月了，雖然網路上的相關文章已經不少，但為了點擊率與完讀率，大多篇幅都不敢太長，在理解門檻較高的細節上，也很常避而不談，不容易滿足想對這個風潮的前因後果有更深了解的人。今年三月出版的《瘋ChatGPT》在則這一塊做了很不錯的統整，應能符合大多數求知慾旺盛的讀者們的期待。

#ChatGPT#OpenAI#聊天機器人

2023/03/29

少鋒的沙龍

《瘋ChatGPT》人工智慧時代最大的挑戰不是技術，而是人類自己

#ChatGPT#OpenAI#聊天機器人

2023/03/29

寶鼎出版的沙龍

從引領風潮也帶來爭議的ChatGPT，反思AI時代所需的人才與技能

ChatGPT 的全名是「Generative Pre-trained Transformer」，簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型，它使用大量的文本資料來訓練自己並且可以生成自然語言文本，可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中，通常也會稱其為「

#ChatGPT#OpenAI#聊天機器人

2023/02/24