避免GPT語言模型危害世界，能力越強責任越大

無限智慧學院

發佈於人工智慧宇宙

更新於 2024/10/24發佈於 2023/10/25閱讀時間約 5 分鐘

The Foundation Model Transparency Index

Rishi Bommasani, Kevin Klyman, Shayne Longpre, Sayash Kapoor, Nestor Maslej, Betty Xiong, Daniel Zhang, Percy Liang

前言:

這篇論文主張，要有一個指標來評量個語言模型的資訊透明度。

無論是訓練資料的取得來源與資料搜集方法，還是模型細節的接露，與產生結果的限制用途與目標客群等等，都是這篇論文關心且要衡量的指標。

藉由評分來防止發行人工智慧的大科技公司可能造成的社會危害⚠️

臉書推出的 llama2 為開源模型，有交代訓練資源，模型細節，使用限制，取得這些競品裡面相對高的的得分

基礎模型透明度指數

基礎模型透明度指數 (以下稱為FMTI) 是一種新的評估工具，用於衡量模型的透明度。通常模型是一種大型語言模型，在大量文本和代碼數據集上進行訓練。

FMTI 由斯坦福大學和麻省理工學院的研究人員開發，是全世界第一個全面評估基礎模型透明度的工具。這個衡量工具對 10 家主要基礎模型開發商 (例如 OpenAI、Google 和 Meta) 進行了評分，評分標準是 100 個關鍵指標，這些指標全面涵蓋了基礎模型的透明度，包括用於構建基礎模型的上游資源、模型本身的細節以及下游使用。

目前總體而言，基礎模型的透明度很低。沒有任何開發商披露有關其旗艦模型對於下游影響的重大信息，例如用戶數量、受影響的市場部門或用戶如何尋求賠償。

發現到的待解決痛點如下：

上游資源：開發人員對用於構建基礎模型的上游資源相對透明，例如使用的數據和計算資源，但是沒有說明取得這些資源所付出的成本，和是否有善盡企業社會責任去照顧好這些資料工人，關於訓練資料的著作權問題，隱私權問題。再來就是訓練所需的運算時間，硬體成本，時間成本，能源消耗，碳排放等等，目前都未必有完整的揭露。
模型細節：開發人員對基礎模型的細節透明度較低，例如使用的特定訓練算法和模型相關的風險，模型的架構與參數量，模型使用上的限制與範圍，目前尚沒有做到大部分論文裡面規範的事項。
下游使用：開發人員對基礎模型的下游使用最不透明，例如模型如何被用戶使用以及在社會上產生了什麼影響，包含如果有模型更新要寫好更新日誌，對外要有免責聲明，詳盡的使用說明書，提及相關使用政策與範圍的事項。

FMTI 是促進基礎模型生態系統透明的重要工具。通過衡量和報告基礎模型的透明度，可以幫助提高人們對此問題的認識並鼓勵開發人員改進他們的透明度做法。

如何提高基礎模型的透明度？

可以採取多種措施來提高基礎模型的透明度。這些措施包括：

開發人員應披露更多有關用於構建其基礎模型的上游資源的信息，例如使用的數據來源和計算資源。這些信息可以幫助用戶了解模型的潛在偏見和局限性。
開發人員應更加透明地披露基礎模型的細節，例如使用的特定訓練算法和模型相關的風險。這些信息可以幫助用戶做出明智的決定如何使用模型。
開發人員應更加透明地披露基礎模型的下游使用情況，例如模型如何被用戶使用以及在社會上產生了什麼影響。這些信息可以幫助確保基礎模型以負責任和道德的方式使用。

除了開發人員之外，政府和其他利益相關者也可以在促進基礎模型生態系統透明度方面發揮作用。例如，政府可以制定法規，要求開發人員披露有關其基礎模型的某些信息。其他利益相關者，例如民間社會組織和學術界，還可以進行研究並提高人們對基礎模型生態系統中透明度重要性的認識。

結論:

這篇論文提出一套具體的關鍵指標，來避免強大的人工智慧從各種維度危害現有的人類社會運行準則，規範了所有發行人工智慧的大科技公司都需要遵守的共同準則，預計藉由大家的努力💪，能實現人工智慧與人類和平共存的願景，以下是論文重點整理。

開發人員應公開發布有關其基礎模型的技術細節，包括訓練數據、算法和架構。
開發人員應建立可靠的審核和監控流程，以識別和解決基礎模型中的偏見和錯誤。
開發人員應與用戶和其他利益相關者合作，開發透明和問責的基礎模型使用政策。

引用:

@article{bommasani2023foundation,
  title={The Foundation Model Transparency Index},
  author={Bommasani, Rishi and Klyman, Kevin and Longpre, Shayne and Kapoor, Sayash and Maslej, Nestor and Xiong, Betty and Zhang, Daniel and Liang, Percy},
  journal={arXiv preprint arXiv:2310.12941},
  year={2023}
}

如果你對 AI 充滿熱情，學習上又不想浪費時間，我能夠以過來人的經驗給你不少想法，歡迎在Facebook群裡面留言。

如果想要用Zoom直接交談，為你直接解惑的，也可以點以下連結預約時間 (1小時)

https://calendly.com/universe_ai/free_appointment

無限智慧學院的沙龍人工智慧宇宙AI社會責任

無限智慧學院的沙龍

95會員

128內容數

帶你用上帝視角，針對市面上具有高度價值的影片/論文/書籍，用東方取象，與西方邏輯辯證的角度同時出發，跟著我一起來探討宇宙萬事萬物的本質，隨時隨地都可以來一場說走就走的思維旅行。作者在台積電 / 聯發科等科技產業有累計10年的資歷，近期對於人工智慧，東方易經，西方辯證邏輯，還有佛法向內求有深度興趣。

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

無限智慧學院的沙龍的其他內容

萬能智慧助理讓您錢多事少-使用Fuyu-8b 模型

訓練一個專屬於自己的守護神有其重要性，可以幫你個性化的解決問題，例如，如果上班常常解讀每個公司的資產負債表，則你可以利用文中的Fuyu-8b model專門的去學習如何看資產負債表，把你手邊有的案例都讓他學習一遍，這樣未來可以解放雙手，輕鬆上班完成任務。

#科技力 #LLM #Transformers

訓練自己的GPT投資顧問，解決投資理財的問題，Finetune Mistral-7B

每天有這麼多的金融數據在變化著，做為一個非全職投資人，要如何同時間掌握這麼多經濟數據與新聞報導，替投資理財做下相對正確的判斷，這時候你會需要自己的投資守護神語言模型，藉由新聞與訊息的整理爬蟲，導入自行訓練的守護神語言模型，讓他每天定時產生社論與投資建議，藉由Email 送出來給您參考，省去你不少時間

#HuggingFace #經濟學家 #Transformers

訓練 OpenAI Whisper V2-幫你的影片上字幕

大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版，可以用來製作屬於自己的自動影片上字幕程式，就讓我們一起來看看吧!

#上字幕 #自動化 #機器人流程自動化

快速取得GPT大模型AI開發的成就

2023年被各大主流媒體稱為AI元年，GPT4 在國際生物奧林匹亞競賽大放異彩，擊敗 99% 的資優生，無人可敵。擁有人工技術，等於擁有世界頂尖員工，24小時不停歇，為你不斷生出結果。然而，多數人對 AI 基本知識仍不明白，知識差距急速擴大，要想不被AI取代，必須懂AI與活用AI。

#人工智慧 #課程 #LLM

萬能智慧助理讓您錢多事少-使用Fuyu-8b 模型

#科技力 #LLM #Transformers

訓練自己的GPT投資顧問，解決投資理財的問題，Finetune Mistral-7B

#HuggingFace #經濟學家 #Transformers

訓練 OpenAI Whisper V2-幫你的影片上字幕