我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
即便是大型語言模型(LLM)有時在特定項目中也會失敗,此時我們應該怎麼做呢?是使用現成的模型設計出好的提示詞?使用嵌入模型進行提示工程?還是微調模型以滿足我們的需求?
每個選擇都有其成本,計算機科學中最好的經驗方法仍然是:
- 依賴可靠且經過優化的評估數據集(包括數量和質量)
- 測試不同的模型和方法,在此情況下,評估通過提示設計、工程和微調所獲得的輸出
- 評估風險和成本
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
即便是大型語言模型(LLM)有時在特定項目中也會失敗,此時我們應該怎麼做呢?是使用現成的模型設計出好的提示詞?使用嵌入模型進行提示工程?還是微調模型以滿足我們的需求?
每個選擇都有其成本,計算機科學中最好的經驗方法仍然是:



























