淺談生成式AI與大語言模型的憂慮與困境

更新於 發佈於 閱讀時間約 4 分鐘

AI浪潮

自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百度的文言一心、Open AI的DALL-E等等,但其中最多人用的還是ChatGPT,而微軟串接Open AI的Bing和Office365,也讓其聲勢大漲,可說是百家追逐、百家爭鳴,都在搶佔AI的高地。

而不只這些,就連AI相關的硬體都跟著聲勢大漲,包括負責生產AI用伺服器的廠商,緯創與相關個股,都紛紛衝的老高,而NVIDIA在其中更是一躍成為全球最炙手可熱的企業,雖然本來就很強了,但現在氣勢更是如日中天。

一個類似人,但又比人更快的服務,是人類追逐的目標,更不用說是它不會累,比起電影、漫畫和卡通裡的未來,彷彿又更近一步了,而且是大大的一步。

不過,在這些的背後,難道AI就沒有挑戰、困難、困境的地方嗎?

有,而且非常的多。

倫理

不光是倫理的問題了,這個是長久以來的問題,在1942年時,美國科幻小說作家艾薩克·艾西莫夫就在其小說轉圈圈其中一個篇章"我,機器人"中,就提出了著名的機器人三原則,其意就在保護人類。

因為一個成熟的AI,比起人類真是完美太多了,如果又讓其掌握了情緒等,那些人類才有的感情,加上又沒有條件去限制AI,那麼等待人類的,那可能不是像駭客任務中,那種人類被奴役的未來,那很大一部分就是被機器人、被AI清空的狀況。

在今年四月初,那些包含馬斯克的大老,就聯手數名一封名為"暫停大型人工智慧實驗"的公開信,想讓大家在現在瘋狂的AI競賽中緩一緩,可見也預期到了擔憂的未來。

同時有些回覆缺乏常識推理和理解,模型往往缺乏對世界知識的深入理解,容易在理解和回答複雜問題時出現錯誤或無法給出準確的答案。

訓練

在前文中提到,各家都在瘋狂的訓練自己的大語言模型,而在這次的AI競賽中,大語言模型(large language model,LLM),本身就是個重中之重的重點,目前看到的諸多生成式AI應用,大語言模型在其中功不可沒,所謂的大語言模型,就是指1000B以上參數的語言模型,透過大量的自監督學習或半監督學習對大量未標記文本進行訓練,讓其資料庫中有更多"有意義"的文本,加上反覆的訓練、微調,讓其更接近一個人類。

但要訓練一個大語言模型,可非是簡單的事情,像是176B的Bloom,當初可是花了法國用超級電腦訓練了100多天才完成,而超級電腦這種東西,可不是簡單就能造出的,尤其各國在超級電腦的競賽,早就是非常熱烈的事情,每年超級電腦的排名都在變化,而且非常花錢,比如目前台灣最強的超級電腦,就是在2018時所打造的"台灣杉二號",花了50億的經費和諸多人力,還包含很多科技、電信大廠投入,上面用了9,072個CPU和插了2,016張NVIDIA Tesla V100,目前NVIDIA Tesla V100一張在PChome賣299,000。

而且有了超級電腦,要訓練一個大語言模型,除了要時間運行外,也需要AI工程師對其訓練的模型進行調教、調整、接受user的反饋,來來回回進行調整,才可以產出"還算勘用"的大語言模型,耗錢、耗時、耗力,非一般單位可以去承受這些。

資料的偏見、隱私與安全

生成式AI可能會受到訓練數據中存在的偏見和不平等的影響。如果訓練數據中存在性別、種族、社會偏見等問題,生成的結果可能會反映這些偏見,進而加劇社會不平等。解決這個問題需要注意數據採集和清洗過程中的公正性,並進行後續的審查和調整,所以像是ChatGPT在訓練的過程中,就透過大量的人力進行貼標,以確保一些非常識或有違倫理的回覆出現。

同時生成式AI需要大量的數據來進行訓練,就算是以大語言模型的基底,那仍然是不足的,比如Bloom,在其中中文的語料就佔的非常少的比例,需要額外添加與再訓練,而在蒐集資料的過程中,就可能蒐集到隱密的資料,這可能涉及到用戶的個人信息和敏感數據。確保數據的隱私和安全性是一個重要的挑戰,需要採取適當的數據保護措施和隱私政策來保護用戶的權益。

不只這些

除了上述的挑戰外,還有很多諸如法律、倫理、版權等等一系列問題。例如,如何處理由AI生成的內容的版權問題?如何確保AI系統的公正性和透明性,以及如何在AI生成內容的過程中遵守隱私法規等等。這些問題需要進行廣泛的討論和製定相關政策來解決。

這些困境,都非一朝一夕能夠處理,除了大量人力時間討論外,還需要針對所處國家不同的人情、法律等作調整,在AI越來越方便的趨勢下,可見未來中,人類的生產力會有質的飛越,可產生的問題也越發明顯,需要眾人的努力去調整、制定。

留言
avatar-img
留言分享你的想法!
avatar-img
Domo沙龍-那些雜七雜八的文章匯集處
26會員
141內容數
Domo的沙龍,各種文章的匯集地 日常、評論、政治、趨勢、時事、職場、工作、創作、小說等。 都是我寫作的內容! 歡迎加入,Domo的沙龍
2025/01/12
在2025的開頭兩個週日,我分別去考了多益口說和多益聽力和閱讀,於是想說趁著記憶猶新,來寫一下考前建議!
Thumbnail
2025/01/12
在2025的開頭兩個週日,我分別去考了多益口說和多益聽力和閱讀,於是想說趁著記憶猶新,來寫一下考前建議!
Thumbnail
2024/12/31
今年快結束了,按慣例,是該來寫一下今年的年度總結
Thumbnail
2024/12/31
今年快結束了,按慣例,是該來寫一下今年的年度總結
Thumbnail
2024/11/18
飢餓行銷雖然可恥,但很有用
Thumbnail
2024/11/18
飢餓行銷雖然可恥,但很有用
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
距離ChatGPT上線也快四個月了,雖然網路上的相關文章已經不少,但為了點擊率與完讀率,大多篇幅都不敢太長,在理解門檻較高的細節上,也很常避而不談,不容易滿足想對這個風潮的前因後果有更深了解的人。今年三月出版的《瘋ChatGPT》在則這一塊做了很不錯的統整,應能符合大多數求知慾旺盛的讀者們的期待。
Thumbnail
距離ChatGPT上線也快四個月了,雖然網路上的相關文章已經不少,但為了點擊率與完讀率,大多篇幅都不敢太長,在理解門檻較高的細節上,也很常避而不談,不容易滿足想對這個風潮的前因後果有更深了解的人。今年三月出版的《瘋ChatGPT》在則這一塊做了很不錯的統整,應能符合大多數求知慾旺盛的讀者們的期待。
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
2021年10月28日全球在夯Meta創辦人佐克伯口中的「元宇宙」;2022年11月30日全球改吹另一風潮──ChatGPT。短短五天內使用人數突破百萬人,曾被微軟挹注十億美元,如今又加碼100億美元的ChatGPT,到底有何魅力?能如此快速的打破國界、突破同溫層,迅速風行各行各業呢?
Thumbnail
2021年10月28日全球在夯Meta創辦人佐克伯口中的「元宇宙」;2022年11月30日全球改吹另一風潮──ChatGPT。短短五天內使用人數突破百萬人,曾被微軟挹注十億美元,如今又加碼100億美元的ChatGPT,到底有何魅力?能如此快速的打破國界、突破同溫層,迅速風行各行各業呢?
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
從MidJourney的AI生成算圖(繪圖)工具(可)讓人參賽得獎,到Open AI的Chat GPT聊天機器人(可回答、翻譯、寫程式、寫文章、藝文創作等),在2022年間讓我們普羅大眾玩得不亦樂乎,蹦出新滋味與玩法,彷彿AI這玩意兒又往人類想像的科技未來目標推進了好幾碼。
Thumbnail
從MidJourney的AI生成算圖(繪圖)工具(可)讓人參賽得獎,到Open AI的Chat GPT聊天機器人(可回答、翻譯、寫程式、寫文章、藝文創作等),在2022年間讓我們普羅大眾玩得不亦樂乎,蹦出新滋味與玩法,彷彿AI這玩意兒又往人類想像的科技未來目標推進了好幾碼。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News