【LLM大型語言模型】 淺談生成式AI的一些困境

更新於 2023/06/30閱讀時間約 1 分鐘
雖然ChatGPT這種基於大型語言模型(LLM)的助手, 在大部分的場景都能滿足我們的需求, 但也並非完美, 在使用時仍需注意一些隱患。
以下是LLM的一些缺陷及需要注意的點。

弱弱的數學造成明顯錯誤

過份樂觀帶來錯誤資訊

相信常常使用ChatGPT的朋友應該都有發現到, 不論我們怎麼提問, ChatGPT都能給我們答案, 而這些答案事實上未必精確, 甚至無從查證。

胡思亂想導致偏差

為什麼LLM總能給我們答案呢? 主要是這種生成式的大型語言模型會基於訓練資料進行統計, 得出機率較大的路徑, 但所謂的機率較大並非正確事實, 也有機率給出錯誤的方向, 才會有胡思亂想的發生, 因為我們期望回答A, 但它未必與我們的理解一致, 因此可能給出答案B並添加於A之上, 導致胡思亂想的狀況發生。

偏見引發歧視

即使有安全防護措施,他們有時也會生成性別歧視/種族歧視/同性戀歧視的內容, 開發面對消費者的應用時務必非常小心, 否則造成負面觀感將導致不可收拾的後果。

結語

一開始我們總被LLM的亮點給吸引了, 卻忽略掉背後的缺陷, 而這些缺陷可能在不知不覺中傷害的他人, 因此我們不能完全相信LLM的回答, 而是必須要有自己的獨立思考能力。
底下是幾個相關的主題:
為什麼會看到廣告
avatar-img
116會員
261內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
阿Han的沙龍 的其他內容
前一篇我們有提到「【Generative AI - Prompt篇】Ep.3 讓AI身歷其境的角色提示法」如何催眠AI成為專家,藉著該提示技巧讓AI可以針對該領域進行專業的回答,但…這還不夠,我們還希望AI可以更強大,可以根據我們設計的範本,進行相同規格的輸入與輸出。 我們在前面幾個篇章也玩過一些P
倖存者偏差(Survivorship bias)是一種認知偏差,指的是在觀察研究對象時,只關注了「倖存」或「成功」的部分,而忽略了已經「消失」或「失敗」的部分。 這種偏差通常發生在樣本不完整或有遺漏的情況下,而且容易導致對結果做出誤導性的評估或推論。 尤其AI的時代來臨,基石源自於數據,數據相當於燃
前面我們有介紹「【Generative AI — Prompt篇】Ep.1 什麼是Prompt Engineering?」相信對於下指令給AI應該已經具有基本知識,那麼這一次我們來介紹Prompt技巧中的其中一環「角色提示法」,這是什麼樣的一種魔法呢? 很簡單,我們就是讓AI變身成專家,賦予特定領域
前面我們有介紹「【Generative AI — Prompt篇】Ep.1 什麼是Prompt Engineering?」相信對於下指令給AI應該已經具有基本知識了吧,在進入Prompt Engineering之前有一些Guideline是我們需要知道的,就如同線上遊戲一般,我們會先進到新手村學習一
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
所謂TF-IDF是由兩個名詞所組成的, 分別是「詞頻(Term Frequency,TF)」和「逆文檔頻率(Inverse Document Frequency,IDF)。 表示詞在文檔中出現的頻率, 就統計學而言, 只要這個詞在文本中出現越多次代表越值得關注, 因此它會具有一個重要的統計評估指標之
前一篇我們有提到「【Generative AI - Prompt篇】Ep.3 讓AI身歷其境的角色提示法」如何催眠AI成為專家,藉著該提示技巧讓AI可以針對該領域進行專業的回答,但…這還不夠,我們還希望AI可以更強大,可以根據我們設計的範本,進行相同規格的輸入與輸出。 我們在前面幾個篇章也玩過一些P
倖存者偏差(Survivorship bias)是一種認知偏差,指的是在觀察研究對象時,只關注了「倖存」或「成功」的部分,而忽略了已經「消失」或「失敗」的部分。 這種偏差通常發生在樣本不完整或有遺漏的情況下,而且容易導致對結果做出誤導性的評估或推論。 尤其AI的時代來臨,基石源自於數據,數據相當於燃
前面我們有介紹「【Generative AI — Prompt篇】Ep.1 什麼是Prompt Engineering?」相信對於下指令給AI應該已經具有基本知識,那麼這一次我們來介紹Prompt技巧中的其中一環「角色提示法」,這是什麼樣的一種魔法呢? 很簡單,我們就是讓AI變身成專家,賦予特定領域
前面我們有介紹「【Generative AI — Prompt篇】Ep.1 什麼是Prompt Engineering?」相信對於下指令給AI應該已經具有基本知識了吧,在進入Prompt Engineering之前有一些Guideline是我們需要知道的,就如同線上遊戲一般,我們會先進到新手村學習一
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
所謂TF-IDF是由兩個名詞所組成的, 分別是「詞頻(Term Frequency,TF)」和「逆文檔頻率(Inverse Document Frequency,IDF)。 表示詞在文檔中出現的頻率, 就統計學而言, 只要這個詞在文本中出現越多次代表越值得關注, 因此它會具有一個重要的統計評估指標之
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
藉由Michal Kosinski教授所撰寫的研究論文中針對大型語言模型(LLMs)中出現人類獨有的心智理論現象,延續討論上篇文章中我所提出「人工智慧與人之間的差異?意識?」一問;並思考我們與AI的距離:當「我思故我在」不僅僅用在人類身上時,我們還有什麼是身為人獨有的特質?
WinGD與CMB.TECH共同開發大型氨燃料發動機 WinGD和CMB.TECH 在以氨為燃料的散貨船船隊方面開始開創性合作,為零碳燃料技術帶來綜合專業知識。
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
2022 #和平文告 我每天讀一點 四天可以讀完 今天讀到第二部分 想要回應一下 ' 剛好最近準備非暴力語言 看了特別有感 【對話意即彼此聆聽、分享不同的觀點,達到共識並同道偕行。在不同世代間的對話中促成這一切,意思就是打破衝突和丟棄文化的硬土,好能播下持久和共同分享和平的種子。】
Thumbnail
大型重型的市場還在成長當中,且近六年的持照人數持續上升中。男性仍為持照大宗,但女性考照人數逐漸增加。 大型重型與黃牌的新掛牌數走勢較為相近,且兩者對考照及格人數連動性很高,屬於同步指標;紅牌不論是與大型重型的掛牌數、還是跟考照及格人數相比對,大部分的時間都走自己的路,連動性較低。
Thumbnail
大盤盤中的動態,有沒有指標工具能幫我們即時做觀察呢? 今天就想來跟各位會員聊聊如何利用XQ盤中的自訂看盤指標,這些指標不僅是常見的內建技術指標,還結合了重點指標股票的簡易統計,善加研究可以輔助判斷盤中的強弱趨勢轉折。
Thumbnail
大盤盤中的動態,有沒有指標工具能幫我們即時做觀察呢? 今天就想來跟各位會員聊聊如何利用XQ盤中的自訂看盤指標,這些指標不僅是常見的內建技術指標,還結合了重點指標股票的簡易統計,善加研究可以輔助判斷盤中的強弱趨勢轉折。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
藉由Michal Kosinski教授所撰寫的研究論文中針對大型語言模型(LLMs)中出現人類獨有的心智理論現象,延續討論上篇文章中我所提出「人工智慧與人之間的差異?意識?」一問;並思考我們與AI的距離:當「我思故我在」不僅僅用在人類身上時,我們還有什麼是身為人獨有的特質?
WinGD與CMB.TECH共同開發大型氨燃料發動機 WinGD和CMB.TECH 在以氨為燃料的散貨船船隊方面開始開創性合作,為零碳燃料技術帶來綜合專業知識。
Thumbnail
什麼是LLM? 根據Meta AI的文章提到,大型語言模型是具有超過 1,000 億個參數的自然語言處理(natural language processing,NLP)系統,經過大量文字訓練,能夠閱讀並回答問題或者生成新的文字。 同時LLM們,不一定只能去產新的文字,而是端看參數是什麼,如果參數的
Thumbnail
2022 #和平文告 我每天讀一點 四天可以讀完 今天讀到第二部分 想要回應一下 ' 剛好最近準備非暴力語言 看了特別有感 【對話意即彼此聆聽、分享不同的觀點,達到共識並同道偕行。在不同世代間的對話中促成這一切,意思就是打破衝突和丟棄文化的硬土,好能播下持久和共同分享和平的種子。】
Thumbnail
大型重型的市場還在成長當中,且近六年的持照人數持續上升中。男性仍為持照大宗,但女性考照人數逐漸增加。 大型重型與黃牌的新掛牌數走勢較為相近,且兩者對考照及格人數連動性很高,屬於同步指標;紅牌不論是與大型重型的掛牌數、還是跟考照及格人數相比對,大部分的時間都走自己的路,連動性較低。
Thumbnail
大盤盤中的動態,有沒有指標工具能幫我們即時做觀察呢? 今天就想來跟各位會員聊聊如何利用XQ盤中的自訂看盤指標,這些指標不僅是常見的內建技術指標,還結合了重點指標股票的簡易統計,善加研究可以輔助判斷盤中的強弱趨勢轉折。
Thumbnail
大盤盤中的動態,有沒有指標工具能幫我們即時做觀察呢? 今天就想來跟各位會員聊聊如何利用XQ盤中的自訂看盤指標,這些指標不僅是常見的內建技術指標,還結合了重點指標股票的簡易統計,善加研究可以輔助判斷盤中的強弱趨勢轉折。