困惑度(Perplexity,簡稱PPL)

更新 發佈閱讀 2 分鐘

困惑度(Perplexity,簡稱PPL)是自然語言處理(NLP)及大型語言模型中常用來衡量模型預測能力的指標。

它的意義在於衡量模型在對一句話或一組語料作預測時的「困惑程度」或「不確定性」:

  • 困惑度越低,表示模型對文本的預測能力越強,能較準確地猜出下一個字詞。 困惑度越高,代表模型在預測時感到越困惑,準確度越差。

數學上,困惑度是語言模型生成語句的平均負對數似然的指數函數,表示模型對語言序列的「平均不確定性」。通俗來說,困惑度衡量模型對語料的「驚訝度」或「混亂度」。 例如:

  • 如果模型對下一個字詞完全確定(機率為1),困惑度為1,意即無任何困惑。 若模型對多個字詞可能性相近,困惑度會增大。

困惑度也是語言模型訓練與評估的重要指標,透過比較不同模型或調整參數來降低困惑度,能提升模型的語言理解與生成效果。

簡單總結:困惑度衡量模型對語言資料預測的「準確性」和「確定程度」,是評估語言模型好壞的重要數據指標。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
21會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/08/26
One-Hot Encoding (獨熱編碼) 核心定義 One-Hot Encoding 是一種將類別型資料 (Categorical Data) 轉換為機器學習模型能夠理解的數值格式的過程。它將每個類別都轉換成一個新的二元(0 或 1)特徵欄位。 它的核心思想是:在
2025/08/26
One-Hot Encoding (獨熱編碼) 核心定義 One-Hot Encoding 是一種將類別型資料 (Categorical Data) 轉換為機器學習模型能夠理解的數值格式的過程。它將每個類別都轉換成一個新的二元(0 或 1)特徵欄位。 它的核心思想是:在
2025/05/27
聊天機器人(Chatbot)是一種基於程式的軟體應用程式或智慧代理,旨在模擬人類的對話,讓用戶能夠透過文字、語音或其他形式的互動來進行交流。聊天機器人的目標是理解使用者的輸入,並根據預定的規則、知識庫或機器學習模型提供相應的回應或完成特定的任務。 聊天機器人的主要目標: 模擬人類對話:使用者感覺
2025/05/27
聊天機器人(Chatbot)是一種基於程式的軟體應用程式或智慧代理,旨在模擬人類的對話,讓用戶能夠透過文字、語音或其他形式的互動來進行交流。聊天機器人的目標是理解使用者的輸入,並根據預定的規則、知識庫或機器學習模型提供相應的回應或完成特定的任務。 聊天機器人的主要目標: 模擬人類對話:使用者感覺
2025/05/27
問答系統(Question Answering,QA)是自然語言處理(NLP)領域的一個重要,指的是一種能夠接收以自然語言提出的問題,並從給定的知識來源(例如文本集合、知識圖譜、資料庫等)中自動查找並提供準確答案的用戶系統。問答系統的目標是讓電腦能夠像與人交流一樣,直接提出問題並獲得簡潔明了的答案,
2025/05/27
問答系統(Question Answering,QA)是自然語言處理(NLP)領域的一個重要,指的是一種能夠接收以自然語言提出的問題,並從給定的知識來源(例如文本集合、知識圖譜、資料庫等)中自動查找並提供準確答案的用戶系統。問答系統的目標是讓電腦能夠像與人交流一樣,直接提出問題並獲得簡潔明了的答案,
看更多
你可能也想看
Thumbnail
解答來囉 (AI設計的縮圖代表算數學很耗能,沒錯!)
Thumbnail
解答來囉 (AI設計的縮圖代表算數學很耗能,沒錯!)
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術,並提供了實際的應用參考點,幫助讀者深入理解自然語言處理的技術。
Thumbnail
語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術,並提供了實際的應用參考點,幫助讀者深入理解自然語言處理的技術。
Thumbnail
以下內容是我閱讀Probabilistic Graphical Model, Koller 2009一書的讀書筆記,未來將不定期新增內容,此技術屬AI人工智慧範疇。 1.2 Structured Probabilistic Models 既然要融入Uncertainty和Probability
Thumbnail
以下內容是我閱讀Probabilistic Graphical Model, Koller 2009一書的讀書筆記,未來將不定期新增內容,此技術屬AI人工智慧範疇。 1.2 Structured Probabilistic Models 既然要融入Uncertainty和Probability
Thumbnail
這陣子使用AI模型,還有參考國內外一些喜歡玩語言模型的同好發文,一個很有趣的結論就是,有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通,會得到比較好的結果,這的確是非常反直覺的,也就是說很多時候ChatGPT耍懶不肯工作的時候,你用加油打氣,或是情緒勒索的方法,確實是可以得到比較好的結果。
Thumbnail
這陣子使用AI模型,還有參考國內外一些喜歡玩語言模型的同好發文,一個很有趣的結論就是,有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通,會得到比較好的結果,這的確是非常反直覺的,也就是說很多時候ChatGPT耍懶不肯工作的時候,你用加油打氣,或是情緒勒索的方法,確實是可以得到比較好的結果。
Thumbnail
你是一個邏輯清楚的人嗎? 每次與人溝通都可以先把所有事情想清楚嗎 那會不會常常發現大家跟不上你的節奏 反而落得一個不知道你在說什麼的囧境呢   其實當發生大家說不知道你在說什麼的時候 有兩種可能性 第一種是你真的邏輯沒有清楚,所以大家不知道你在說什麼 第二種則是你的邏輯因為先想過
Thumbnail
你是一個邏輯清楚的人嗎? 每次與人溝通都可以先把所有事情想清楚嗎 那會不會常常發現大家跟不上你的節奏 反而落得一個不知道你在說什麼的囧境呢   其實當發生大家說不知道你在說什麼的時候 有兩種可能性 第一種是你真的邏輯沒有清楚,所以大家不知道你在說什麼 第二種則是你的邏輯因為先想過
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
Thumbnail
瞭解人生決策過程中的關鍵能力,包括把握人生精度、看透世界本質、提升決策品質、思維進化與重啟、領導/管理智慧鑑識以及精進商業模式。學習在判斷力、思考維度、槓桿和深度思考方面提高自己的能力,同時改變思維模式和成功經營模式,挑戰自我,在市場競逐中找到關鍵的能力。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News