微調

含有「微調」共 7 篇內容

全部內容

發佈日期由新至舊

壹肆說壹肆

2024/09/06

15 〇到一百的透明度

曾經特別害怕在人山人海裡變得透明，所以執著於想被看見。現在仍然想被看見，大概是某種生物本能，害怕和嚮往是硬幣的兩面。差別於不再把自己困在某種要是做到可能就會被喜歡的樣板裡，不再對自己附加沒有的條件。

#透明 #自我認知 #微調

麻吉

2024/09/06

分析得很有道理.......

Raphael AI 科學家

2024/03/01

ChatGPT 模型訓練：RLHF 技術解析

ChatGPT 是 OpenAI 開發的大型語言模型，以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段：預訓練和微調。微調使用了 RLHF（Reinforcement Learning from Human Feedback）技術，可以有效地提高模型生成內容的質量。

挫折是一種不讓人喜愛的感受，因為它會讓你覺得自己失敗了，並可能因此就陷入低潮。紓解快的人大約花幾天，慢的人可能花幾個月，沒辦法的人最後可能得了心理疾病。不過，挫折真的有那麼可怕嗎？首先，我們先仔細思考一下，產生挫折感的原因為何？一言以蔽之，就是：期待與所得不符合。比如說：期待考上全美排行

#挫折 #期待 #微調

Angela Chen

2023/11/21

與預期不符，會產生挫折，但把標準訂得太低，又會缺乏成就感，了解自己的位置在哪，真是兩難啊！

烹飪睡覺泡茶喝 (Camellia)

發文者

2024/01/02

清月這也是身為人的趣味，可以不斷的探索跟體驗。每一天的妳都是不一樣的，就好比當初正在寫完這篇文章的我，跟發表完此文章的我，其實已經不是同一個。又好比正在回覆訊息的我，跟回完的我，其實也不是同一個，人類就是可以不斷往前走跟探索自身邊界的物種。有些人習慣停在原點，但其實他們也不是真的停在原點。

付費限定

無限智慧學院的沙龍

2023/10/29

發揮以小搏大的精神，直接蒸餾法訓練Mistral 7B

為了使小模型取得大模型的回答水平這篇論文提出了三招，"大幅度"提升Mistral 7B模型的回答準確率如果有想要把LLM微調好的人，一定不能錯過這篇

#科技力 #Mistral #GPT-4

無限智慧學院的沙龍

2023/10/24

萬能智慧助理讓您錢多事少-使用Fuyu-8b 模型

訓練一個專屬於自己的守護神有其重要性，可以幫你個性化的解決問題，例如，如果上班常常解讀每個公司的資產負債表，則你可以利用文中的Fuyu-8b model專門的去學習如何看資產負債表，把你手邊有的案例都讓他學習一遍，這樣未來可以解放雙手，輕鬆上班完成任務。

#科技力 #LLM #Transformers

Ted Chen的沙龍

2023/05/31

ChatGPT關鍵技術，GPT 怎麼變成 ChatGPT 的？

這篇文章揭示了訓練GPT模型的三個核心技術：預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力；微調讓GPT更貼近人類思維偏好；增強式學習最終優化模型回答問題的方式。此外，多語言預訓練能讓GPT在一語言的任務學習後，自動掌握其他語言的同樣任務。

平衡，不是靜止不動，而是一種內在的狀態；生活裡，無時無刻不在變動著，平衡，是在每一個動態裡，去做出微調，做出改變，得到當下平衡的狀態。失衡，是過度與不及，容易使我們處於緊繃、擔憂、害怕、焦慮的狀態，那使我們難以靠近自己、與自己連結，容易深陷在情緒裡無法自拔。因此，穩定自己很重要，

#內在的狀態 #變動 #微調

Fornik Tsai

2022/05/13

是的！平衡自己很重要！

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌