淺談生成式AI與大語言模型的憂慮與困境

更新 發佈閱讀 4 分鐘

AI浪潮

自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百度的文言一心、Open AI的DALL-E等等,但其中最多人用的還是ChatGPT,而微軟串接Open AI的Bing和Office365,也讓其聲勢大漲,可說是百家追逐、百家爭鳴,都在搶佔AI的高地。

而不只這些,就連AI相關的硬體都跟著聲勢大漲,包括負責生產AI用伺服器的廠商,緯創與相關個股,都紛紛衝的老高,而NVIDIA在其中更是一躍成為全球最炙手可熱的企業,雖然本來就很強了,但現在氣勢更是如日中天。

一個類似人,但又比人更快的服務,是人類追逐的目標,更不用說是它不會累,比起電影、漫畫和卡通裡的未來,彷彿又更近一步了,而且是大大的一步。

不過,在這些的背後,難道AI就沒有挑戰、困難、困境的地方嗎?

有,而且非常的多。

倫理

不光是倫理的問題了,這個是長久以來的問題,在1942年時,美國科幻小說作家艾薩克·艾西莫夫就在其小說轉圈圈其中一個篇章"我,機器人"中,就提出了著名的機器人三原則,其意就在保護人類。

因為一個成熟的AI,比起人類真是完美太多了,如果又讓其掌握了情緒等,那些人類才有的感情,加上又沒有條件去限制AI,那麼等待人類的,那可能不是像駭客任務中,那種人類被奴役的未來,那很大一部分就是被機器人、被AI清空的狀況。

在今年四月初,那些包含馬斯克的大老,就聯手數名一封名為"暫停大型人工智慧實驗"的公開信,想讓大家在現在瘋狂的AI競賽中緩一緩,可見也預期到了擔憂的未來。

同時有些回覆缺乏常識推理和理解,模型往往缺乏對世界知識的深入理解,容易在理解和回答複雜問題時出現錯誤或無法給出準確的答案。

訓練

在前文中提到,各家都在瘋狂的訓練自己的大語言模型,而在這次的AI競賽中,大語言模型(large language model,LLM),本身就是個重中之重的重點,目前看到的諸多生成式AI應用,大語言模型在其中功不可沒,所謂的大語言模型,就是指1000B以上參數的語言模型,透過大量的自監督學習或半監督學習對大量未標記文本進行訓練,讓其資料庫中有更多"有意義"的文本,加上反覆的訓練、微調,讓其更接近一個人類。

但要訓練一個大語言模型,可非是簡單的事情,像是176B的Bloom,當初可是花了法國用超級電腦訓練了100多天才完成,而超級電腦這種東西,可不是簡單就能造出的,尤其各國在超級電腦的競賽,早就是非常熱烈的事情,每年超級電腦的排名都在變化,而且非常花錢,比如目前台灣最強的超級電腦,就是在2018時所打造的"台灣杉二號",花了50億的經費和諸多人力,還包含很多科技、電信大廠投入,上面用了9,072個CPU和插了2,016張NVIDIA Tesla V100,目前NVIDIA Tesla V100一張在PChome賣299,000。

而且有了超級電腦,要訓練一個大語言模型,除了要時間運行外,也需要AI工程師對其訓練的模型進行調教、調整、接受user的反饋,來來回回進行調整,才可以產出"還算勘用"的大語言模型,耗錢、耗時、耗力,非一般單位可以去承受這些。

資料的偏見、隱私與安全

生成式AI可能會受到訓練數據中存在的偏見和不平等的影響。如果訓練數據中存在性別、種族、社會偏見等問題,生成的結果可能會反映這些偏見,進而加劇社會不平等。解決這個問題需要注意數據採集和清洗過程中的公正性,並進行後續的審查和調整,所以像是ChatGPT在訓練的過程中,就透過大量的人力進行貼標,以確保一些非常識或有違倫理的回覆出現。

同時生成式AI需要大量的數據來進行訓練,就算是以大語言模型的基底,那仍然是不足的,比如Bloom,在其中中文的語料就佔的非常少的比例,需要額外添加與再訓練,而在蒐集資料的過程中,就可能蒐集到隱密的資料,這可能涉及到用戶的個人信息和敏感數據。確保數據的隱私和安全性是一個重要的挑戰,需要採取適當的數據保護措施和隱私政策來保護用戶的權益。

不只這些

除了上述的挑戰外,還有很多諸如法律、倫理、版權等等一系列問題。例如,如何處理由AI生成的內容的版權問題?如何確保AI系統的公正性和透明性,以及如何在AI生成內容的過程中遵守隱私法規等等。這些問題需要進行廣泛的討論和製定相關政策來解決。

這些困境,都非一朝一夕能夠處理,除了大量人力時間討論外,還需要針對所處國家不同的人情、法律等作調整,在AI越來越方便的趨勢下,可見未來中,人類的生產力會有質的飛越,可產生的問題也越發明顯,需要眾人的努力去調整、制定。

留言
avatar-img
Domo沙龍:在文字中發掘邏輯與靈魂的隱玉
28會員
148內容數
這裡是邏輯與感性的交會之處,也是我觀察世界的窗口。 我將深刻的職場觀測與時事趨勢,對應溫潤的心靈共鳴與日常體悟,並在虛構小說的敘事實驗中探尋真實。 每一篇文字,都是將生活的深度鑽研,凝煉成閃耀的隱玉。 在 Domo 的沙龍裡,在字裡行間,尋找那份觸動心靈的真實。 讓我們攜手,一起展開這場文字的旅程。
2025/01/12
在2025的開頭兩個週日,我分別去考了多益口說和多益聽力和閱讀,於是想說趁著記憶猶新,來寫一下考前建議!
Thumbnail
2025/01/12
在2025的開頭兩個週日,我分別去考了多益口說和多益聽力和閱讀,於是想說趁著記憶猶新,來寫一下考前建議!
Thumbnail
2024/12/31
今年快結束了,按慣例,是該來寫一下今年的年度總結
Thumbnail
2024/12/31
今年快結束了,按慣例,是該來寫一下今年的年度總結
Thumbnail
2024/11/18
飢餓行銷雖然可恥,但很有用
Thumbnail
2024/11/18
飢餓行銷雖然可恥,但很有用
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
創業者常因資金困境而無法抓住機會,利用房產活化讓二胎房貸成為財務策略的有力夥伴。 諮詢國峯厝好貸的二胎房貸服務,讓你的房子成為你最強力的天使投資人,推動事業成長。
Thumbnail
創業者常因資金困境而無法抓住機會,利用房產活化讓二胎房貸成為財務策略的有力夥伴。 諮詢國峯厝好貸的二胎房貸服務,讓你的房子成為你最強力的天使投資人,推動事業成長。
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
距離ChatGPT上線也快四個月了,雖然網路上的相關文章已經不少,但為了點擊率與完讀率,大多篇幅都不敢太長,在理解門檻較高的細節上,也很常避而不談,不容易滿足想對這個風潮的前因後果有更深了解的人。今年三月出版的《瘋ChatGPT》在則這一塊做了很不錯的統整,應能符合大多數求知慾旺盛的讀者們的期待。
Thumbnail
距離ChatGPT上線也快四個月了,雖然網路上的相關文章已經不少,但為了點擊率與完讀率,大多篇幅都不敢太長,在理解門檻較高的細節上,也很常避而不談,不容易滿足想對這個風潮的前因後果有更深了解的人。今年三月出版的《瘋ChatGPT》在則這一塊做了很不錯的統整,應能符合大多數求知慾旺盛的讀者們的期待。
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
2021年10月28日全球在夯Meta創辦人佐克伯口中的「元宇宙」;2022年11月30日全球改吹另一風潮──ChatGPT。短短五天內使用人數突破百萬人,曾被微軟挹注十億美元,如今又加碼100億美元的ChatGPT,到底有何魅力?能如此快速的打破國界、突破同溫層,迅速風行各行各業呢?
Thumbnail
2021年10月28日全球在夯Meta創辦人佐克伯口中的「元宇宙」;2022年11月30日全球改吹另一風潮──ChatGPT。短短五天內使用人數突破百萬人,曾被微軟挹注十億美元,如今又加碼100億美元的ChatGPT,到底有何魅力?能如此快速的打破國界、突破同溫層,迅速風行各行各業呢?
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
從MidJourney的AI生成算圖(繪圖)工具(可)讓人參賽得獎,到Open AI的Chat GPT聊天機器人(可回答、翻譯、寫程式、寫文章、藝文創作等),在2022年間讓我們普羅大眾玩得不亦樂乎,蹦出新滋味與玩法,彷彿AI這玩意兒又往人類想像的科技未來目標推進了好幾碼。
Thumbnail
從MidJourney的AI生成算圖(繪圖)工具(可)讓人參賽得獎,到Open AI的Chat GPT聊天機器人(可回答、翻譯、寫程式、寫文章、藝文創作等),在2022年間讓我們普羅大眾玩得不亦樂乎,蹦出新滋味與玩法,彷彿AI這玩意兒又往人類想像的科技未來目標推進了好幾碼。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News