筆記-曲博談AI模型.群聯-24.05.05

股海牛車

發佈於請支援收銀

2024/05/06 更新2024/05/06 發佈閱讀 1 分鐘

投資理財內容聲明

筆記-曲博談AI模型.群聯-24.05.05

https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s

*大型語言模型三個步驟:

1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。

2.微調(fine tune)，預訓練之後，類神經網路裡的參數還不夠精準，所以需要微調，

例如要用來做翻譯功能的語言模型，就要把翻譯的資料、明確的輸入到神經網路，去微調這個參數。

微調完之後，才會得到一個可以拿來應用的模型。

3.推論，把要翻譯的資料輸入，模型經過推論運算，會輸入翻譯好的結果。

*訓練，類似花10年學英文、運算量龐大，學好之後等於把英文的模型建立好；

遇到外國人時講英文，這就是推論。

*推論，需要的處理效能不高，但是推論是個很長時間的運用，會有大量的使用者、不停的運算，

可以不用最高階的處理器，需要的處理器數量龐大。

*微調，用大量的數據，標註、改變微調參數，不用大量的運算，需要的是大量的記憶體，所以需要記憶體容量大的伺服器。

*HBM在GPU旁邊，先進封裝能夠封的HBM記憶體數量是固定的，

想要做微調的廠商，如果拿訓練用的伺服器來做微調，成本很高，因為只是需要記憶體，並不用那麼多的算力。

--群聯作的是快閃記憶體固態硬碟，屬於速度比較慢的記憶體，

在微調的時候，可以用中介軟體，讓程式誤以為固態硬碟是跟HBM一樣的記憶體，就可以用低成本的方式放大記憶體容量，因為固態硬碟的容量大，

群聯的aiDAPTIV，屬於微調專用的伺服器，

讓企業可以拿別人預訓練好的大模型，用低價的微調伺服器，微調成企業想要做的產品。

*曲博也認為aiDAPTIV為正確的發展方向。

每日發車請支援收銀

留言

留言分享你的想法！

每日發車

85會員

270內容數

股市x 投資x 自耕農

每日發車的其他內容

2024/09/04

每日台股車況-24.09.04四

每日台股車況-24.09.04四今日牛棚: 無今日上車: 無今日下車: *昇達科3491 24/08/19 24/09/04 -3.7% 第二次跌破10MA，出場。高檔上漲/量增O/收斂O/其他低軌衛星不強=/低軌衛星題材O

2024/09/04

每日台股車況-24.09.04四

2024/09/04

每日台股車況-24.09.03三

每日台股車況-24.09.03三今日牛棚: 無今日上車: *金像電2368 24/09/03 第一天加入。底部起漲/量增O/收斂O/PCB族群轉強O/營收成長強O；外資↑投信↑大戶= 今日下車: 無目前組合

2024/09/04

每日台股車況-24.09.03三

2024/09/02

每日台股車況-24.09.02一

每日台股車況-24.09.02一今日牛棚: 無今日上車: *時碩工業4566 24/09/02 高檔上漲/量增O/收斂O/機器人零件族群強O/營收成長強O；外資↓投信=大戶↑ 今日下車: 無目前組合

2024/09/02

每日台股車況-24.09.02一

看更多

你可能也想看

小蝸慢慢爬

婚禮開箱-我們的婚禮有多少東西是從蝦皮買的？！同場加映新婚夫妻必備推薦

結婚是一個重大的決定，而辦婚禮更是一件耗時間耗心力又得花大錢的事。但這可是小豬和小蝸一生一次的重大決定，就算沒有太多錢，也不想失去該有的質感怎麼辦？今天就來開箱小豬和小蝸的婚禮，和大家分享我們怎麼用少少的錢買到那些不可或缺的東西。當然是靠蝦皮購物啊!!!

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

小蝸慢慢爬

婚禮開箱-我們的婚禮有多少東西是從蝦皮買的？！同場加映新婚夫妻必備推薦

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

他口趴趴走

入厝好物分享｜蝦皮分潤計畫 × 佈置新家的小確幸

分享新家入住與佈置的蝦皮購物好物，包含入厝儀式用品、玄關收納、衣櫥整理等。同時介紹蝦皮「分潤計畫」，教學如何操作並分享聯盟行銷優點，以及雙11購物優惠資訊，鼓勵讀者一同加入賺取額外收入。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

他口趴趴走

入厝好物分享｜蝦皮分潤計畫 × 佈置新家的小確幸

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

Learn AI 不 BI

AI說書 - Prompt Engineering - 57

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們把 AI說書 - Prompt Engineering - 55 和 AI說書 - Prompt E

#AI#ai#PromptEngineering

2024/07/24

Learn AI 不 BI

AI說書 - Prompt Engineering - 57

#AI#ai#PromptEngineering

2024/07/24

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。針對Generative AI、Foundation Model、Large Language Mode

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 3

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在AI說書 - Prompt Engineering - 2中，我們已經以文字敘述各種AI的範疇與其思想

#AI#ai#PromptEngineering

2024/06/06

Learn AI 不 BI

AI說書 - Prompt Engineering - 3

#AI#ai#PromptEngineering

2024/06/06

程式輕鬆玩

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

2024/05/15

2024/05/15

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

技術PM路易斯的沙龍

情緒勒索你的AI來得到最佳的結果

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

#chatgpt#LLM#AI

2024/03/31