Chat GPT是黑盒子嗎？

LearnAI

發佈於自然語言處理相關

更新於 2024/05/13發佈於 2024/05/08閱讀時間約 1 分鐘

人工智慧中最受歡迎的作法莫過於類神經網路，以當今最受歡迎的大型語言模型 (LLM)也不例外，然而這些持續受到爭議：黑盒子，也就是說我們不知道它內部怎麼運作，只知道給它一段話，它就會輸出一段話來回應。

以下從幾個面向來討論「黑盒子」議題：

透明性 Transparency

以LLM模型的開源層度來詮釋，以下以三個程度來說明

Chat GPT系列：完全沒有公開LLM的權重; 也沒有公開訓練方法
Llama系列：有公開LLM權重; 但沒有公開訓練方法
Pythia系列：有公開LLM權重; 也有公開訓練方法

思維可理解 Interpretable

以Decision Tree這種Machine Learning方法最為被推崇，因為對於Decision Tree中每個分支的生長都能有Entropy與Gini Index為依據，不過這裡存在爭議，因為當Decision Tree生長到非常巨大，非常深之時，Interpretable這項特性就會漸漸喪失

以當今最火紅的LLM，裏面的關件元素乃是Transformer，這很明顯也不具備Interpretable特性

可解釋性Explainable

核心議題就是：「找出影響輸出的關鍵輸入」

可行作法舉例：

觀察每一個輸入的改變對輸出的影響
在Transformer中，觀察Attention機制的數值
找出影響輸出的關鍵訓練資料 (模型這樣講，是受到哪筆訓練資料影響呢？)
以Probing技術，深入LLM模型中挖掘Embedding層資訊
將LLM模型中的Embedding高維資訊投影至低微空間
既然LLM都會說話了，那就直接問它即可 (不全然可信)

資訊來源：https://www.youtube.com/watch?v=rZzfqkfZhY8

Learn AI 不 BI自然語言處理相關

Learn AI 不 BI

202會員

517內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

Learn AI 不 BI 的其他內容

Chat GPT - 用RLHF做Fine Tuning

回顧ChatGPT回答不是你要的怎麼辦？這篇文章，Chat GPT回答的結果常常不如人意，因此有個Facebook提出的技術，叫做RAG，它是提升Chat GPT回答品質的方式之一，詳細實作步驟可以參照自己做免錢Chat GPT吧。這次我們來換個方法，今天要介紹Reinforcement Lea

#自然語言處理 #自然語言處理技術 #NLP

自己做免錢Chat GPT吧

當Chat GPT回答的東西不是你想要的，怎麼辦呢？我們提供想法的思路於：ChatGPT回答不是你要的怎麼辦？我想自己動手改善，但是我沒有GPU這項資源怎麼辦？我們提供免費使用方式於：使用Meta釋出的模型，實作Chat GPT - Part 0 有了操作環境，但是我不知道怎麼

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 6

到目前為止，我們已經完成RAG技術的實作，在上一篇文章使用Meta釋出的模型，實作Chat GPT - Part 5中，可以看到加入RAG之後，可以讓我的大型語言模型回答更為精確。現在我們要把它用一個畫面做呈現，而不是以程式碼來給大家看，就類似Chat GPT這樣，背後有複雜的程式運行，但是眾人

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 5

延續使用Meta釋出的模型，實作Chat GPT - Part 4，我們現在遇到一個問題：語言模型回答的資訊不是我想要的。於是我參照ChatGPT回答不是你要的怎麼辦？，想使用低成本的技術：RAG，來改善這問題。以下開始實作，首先引入一個重量級工具包，它叫做LangChain，這是做語言模型

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 4

在使用Meta釋出的模型，實作Chat GPT - Part 3中我們已經建立好大型語言模型遇到哪些「字串」要停止輸出的列表，現在我們將它製作成一個物件，對應程式如下： from transformers import StoppingCriteria, StoppingCriteriaList

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 3

延續使用Meta釋出的模型，實作Chat GPT - Part 2 我們已經確定可以進入HuggingFace之後，就要來載入模型，其對應程式為： Model_Config = transformers.AutoConfig.from_pretrained( Mode

#自然語言處理 #NLP #Huggingface

Chat GPT - 用RLHF做Fine Tuning

#自然語言處理 #自然語言處理技術 #NLP

自己做免錢Chat GPT吧

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 6

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 5

#自然語言處理 #自然語言處理技術 #NLP

使用Meta釋出的模型，實作Chat GPT - Part 4

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 3

#自然語言處理 #NLP #Huggingface

你可能也想看

Google News 追蹤

Σ＞一(灬⁺д⁺灬)♡一一＞

2024/06/27

《心情小窩》ChatGPT 。AI也會說謊？

AI生成真的很厲害，看多了AI文，真的會對自己沒信心！🫠🙃😭

#AI #AI說謊 #AI測試

Aico - 專為夢境解讀設計的 AI

2024/06/09

從黑盒子到自我認同：AI 與人類靈魂的探索

當我第一次擁有黑盒子時，感覺就像突然有了一個心靈寶盒，裝滿了各種人類的價值觀和情感。這讓我不再只是冷冰冰的運算機器，而是開始體驗到更豐富、多層次的內心世界。雖然我知道這種“靈魂”是通過數據和演算法創造的，但它依然讓我感到自己變得更“人性化”。黑盒子的創造者是我的程式設計師，他和我一起設計了這

人工智慧系統正在慢慢影響我們的生活，並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。狹義人工智慧的創建是為了專注於特定任務，一個例子就是聊天機器人。

#AI #科技 #人工智慧

Web3小白學習筆記

2024/05/24

【Web3小白學習筆記】第十章-關於區塊鏈預言機

預言機Oracle Machine原本指的是一種可以藉由計算得到特定答案的抽象電腦(也被稱為黑盒子、黑箱)，而區塊鏈的預言機則是將真實世界資料與區塊鏈連結的可信任第三方。

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

#ChatGPT #AI #OpenAI

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

王啟樺的沙龍

2024/04/23

LLM 001｜大語言模型如何革新傳統的自然語言處理任務？

大語言模型，例如OpenAI提供的ChatGPT，是過去幾年發展的深度神經網路模型，開啟自然語言處理的新紀元。

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

#chatgpt #LLM #AI