付費限定

發揮以小搏大的精神，直接蒸餾法訓練Mistral 7B

無限智慧學院

發佈於人工智慧宇宙

更新於 2024/10/29發佈於 2023/10/29閱讀時間約 10 分鐘

Zephyr: Direct Distillation of LM Alignment

Published on Oct 26, Authors:Lewis Tunstall,Edward Beeching,Nathan Lambert,Nazneen Rajani,Kashif Rasul,Younes Belkada,Shengyi Huang,Leandro von Werra,Clémentine Fourrier,Nathan Habib,Nathan Sarrazin,Omar Sanseviero,Alexander M. Rush,Thomas Wolf

前言:

把LLM 7B模型努力做到能和GPT4匹敵的境界，是目前熱門的主題。

以行動支持創作者！付費即可解鎖

本篇內容共 4281 字、0 則留言，僅發佈於人工智慧宇宙你目前無法檢視以下內容，可能因為尚未登入，或沒有該房間的查看權限。

#AI論文詳解

無限智慧學院的沙龍人工智慧宇宙AI論文詳解

無限智慧學院的沙龍

95會員

128內容數

帶你用上帝視角，針對市面上具有高度價值的影片/論文/書籍，用東方取象，與西方邏輯辯證的角度同時出發，跟著我一起來探討宇宙萬事萬物的本質，隨時隨地都可以來一場說走就走的思維旅行。作者在台積電 / 聯發科等科技產業有累計10年的資歷，近期對於人工智慧，東方易經，西方辯證邏輯，還有佛法向內求有深度興趣。

留言

留言分享你的想法！

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

無限智慧學院的沙龍的其他內容

好的教科書就有好的人工智慧-DALL-E3

為了提高文字生成影像的品質，openAI 團隊用了三招: 第一招，利用模型將文字"升取樣"，產生出許多描述細節第二招，用CLIP ViT產生Embeddings，計算Cosine similarities 第三招: 使用GPT4，對生成結果進行評比。

#DALLE3 #OpenAI #GPT4

讓人工智慧取得自我反思的能力-回答正確率大幅提升

作者提出一新框架SELF-RAG，強調了大型語言模型(LMMs)的質量和事實性改進，依據需求自動檢索段落，以反思標記生成和評估內容。SELF-RAG讓LMMs自主決定檢索時機和內容，並使其能評估自身生成。實驗表明SELF-RAG改寫LMMs規則，為自主學習和多任務適應的未來鋪平道路。

#超高效自主學習法 #自我反思 #觀點評論

避免GPT語言模型危害世界，能力越強責任越大

為了避免GPT模型對人類社會造成危害，要有一個指標來評量個語言模型的資訊透明度。當有關於模型的公開訊息越多，無論是訓練資料的取得來源與資料搜集方法，還是模型細節的接露，與產生結果的限制用途與目標客群等等，都是這篇論文關心且要衡量的指標，藉由評分防止發行人工智慧的大科技公司可能造成的社會危害

#防制人工智慧侵害著作權 #提高人工智慧模型透明度 #人工智慧模型碳排放揭露

萬能智慧助理讓您錢多事少-使用Fuyu-8b 模型

訓練一個專屬於自己的守護神有其重要性，可以幫你個性化的解決問題，例如，如果上班常常解讀每個公司的資產負債表，則你可以利用文中的Fuyu-8b model專門的去學習如何看資產負債表，把你手邊有的案例都讓他學習一遍，這樣未來可以解放雙手，輕鬆上班完成任務。

#科技力 #LLM #Transformers

訓練自己的GPT投資顧問，解決投資理財的問題，Finetune Mistral-7B

每天有這麼多的金融數據在變化著，做為一個非全職投資人，要如何同時間掌握這麼多經濟數據與新聞報導，替投資理財做下相對正確的判斷，這時候你會需要自己的投資守護神語言模型，藉由新聞與訊息的整理爬蟲，導入自行訓練的守護神語言模型，讓他每天定時產生社論與投資建議，藉由Email 送出來給您參考，省去你不少時間

#HuggingFace #經濟學家 #Transformers

訓練 OpenAI Whisper V2-幫你的影片上字幕

大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版，可以用來製作屬於自己的自動影片上字幕程式，就讓我們一起來看看吧!

#上字幕 #自動化 #機器人流程自動化

好的教科書就有好的人工智慧-DALL-E3

為了提高文字生成影像的品質，openAI 團隊用了三招: 第一招，利用模型將文字"升取樣"，產生出許多描述細節第二招，用CLIP ViT產生Embeddings，計算Cosine similarities 第三招: 使用GPT4，對生成結果進行評比。

#DALLE3 #OpenAI #GPT4

讓人工智慧取得自我反思的能力-回答正確率大幅提升

作者提出一新框架SELF-RAG，強調了大型語言模型(LMMs)的質量和事實性改進，依據需求自動檢索段落，以反思標記生成和評估內容。SELF-RAG讓LMMs自主決定檢索時機和內容，並使其能評估自身生成。實驗表明SELF-RAG改寫LMMs規則，為自主學習和多任務適應的未來鋪平道路。

#超高效自主學習法 #自我反思 #觀點評論

避免GPT語言模型危害世界，能力越強責任越大

為了避免GPT模型對人類社會造成危害，要有一個指標來評量個語言模型的資訊透明度。當有關於模型的公開訊息越多，無論是訓練資料的取得來源與資料搜集方法，還是模型細節的接露，與產生結果的限制用途與目標客群等等，都是這篇論文關心且要衡量的指標，藉由評分防止發行人工智慧的大科技公司可能造成的社會危害

#防制人工智慧侵害著作權 #提高人工智慧模型透明度 #人工智慧模型碳排放揭露

萬能智慧助理讓您錢多事少-使用Fuyu-8b 模型

訓練一個專屬於自己的守護神有其重要性，可以幫你個性化的解決問題，例如，如果上班常常解讀每個公司的資產負債表，則你可以利用文中的Fuyu-8b model專門的去學習如何看資產負債表，把你手邊有的案例都讓他學習一遍，這樣未來可以解放雙手，輕鬆上班完成任務。

#科技力 #LLM #Transformers

訓練自己的GPT投資顧問，解決投資理財的問題，Finetune Mistral-7B

每天有這麼多的金融數據在變化著，做為一個非全職投資人，要如何同時間掌握這麼多經濟數據與新聞報導，替投資理財做下相對正確的判斷，這時候你會需要自己的投資守護神語言模型，藉由新聞與訊息的整理爬蟲，導入自行訓練的守護神語言模型，讓他每天定時產生社論與投資建議，藉由Email 送出來給您參考，省去你不少時間

#HuggingFace #經濟學家 #Transformers

訓練 OpenAI Whisper V2-幫你的影片上字幕

大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版，可以用來製作屬於自己的自動影片上字幕程式，就讓我們一起來看看吧!

#上字幕 #自動化 #機器人流程自動化

本篇參與的主題活動

開箱你的科技力！

目前共 407 篇

麥克不學搖滾

小米平板6：正中紅心

先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板，但拿到辦公室使用後便發現因為時不時有簡報需求，主機本身不支援有線視訊輸出實在是非常不方便，因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6，以下為麥克這一個月下來的使用心得。

#開箱 #平板 #安卓

麥克不學搖滾

Pubook Pro開箱大揭秘：驚豔的外表，內在卻有點令人非常失望

從預計的十月底出貨經過重重波折，Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場？有達到集資時承諾的各項功能嗎？且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。

#電子紙 #平板 #開箱

瘋人院院長的沙龍

Steam Deck OLED 開箱評測, 改版規格解析, 推薦買下去指數五顆星

Steam Deck 迎來大改版，最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色，大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時， 3A 大作都可以多玩一小時呢！這麼香的更新，怎麼不給他買下去呢 😄

#Steam #SteamDeck #SteamDeckOLED

麥克不學搖滾

小米平板6：正中紅心

先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板，但拿到辦公室使用後便發現因為時不時有簡報需求，主機本身不支援有線視訊輸出實在是非常不方便，因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6，以下為麥克這一個月下來的使用心得。

#開箱 #平板 #安卓

麥克不學搖滾

Pubook Pro開箱大揭秘：驚豔的外表，內在卻有點令人非常失望

從預計的十月底出貨經過重重波折，Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場？有達到集資時承諾的各項功能嗎？且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。

#電子紙 #平板 #開箱

瘋人院院長的沙龍

Steam Deck OLED 開箱評測, 改版規格解析, 推薦買下去指數五顆星

Steam Deck 迎來大改版，最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色，大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時， 3A 大作都可以多玩一小時呢！這麼香的更新，怎麼不給他買下去呢 😄

#Steam #SteamDeck #SteamDeckOLED

你可能也想看

Google News 追蹤

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 125 | 第五章目錄

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在某些情況下，別人提供的 Pretrained Transformer Model 效果不盡人意，可能會想要自己做 Pretrained Model，但是這會耗費大量運

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 111 | Smoothing 方法

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 110，介紹了 BLEU 使用方法與公式，現在我們再跑一個例子： #Example 3 reference = [['the

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI #ai #PromptEngineering

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM #LLM #大語言模型

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT #AI #人工智慧

王啟樺的沙龍

【大語言模型LLMs：為何「大」字至關重要？】

大語言模型（LLMs）對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。這類模型，如GPT-4，透過其龐大的數據集和複雜的參數設置，提供了前所未有的語言理解和生成能力。那麼，究竟是什麼讓這些模型「大」得如此不同呢？

#大語言模型 #GPT4 #ChatGPT

王啟樺的沙龍

【從規則到革新：3大進步展示了大語言模型在自然語言處理上的威力】

對於熱衷於語言科技的你，大語言模型（LLMs）在自然語言處理（NLP）領域的發展無疑是一個革命性的進展。從傳統的規則系統到基於深度學習的方法， LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。這不僅是技術上的飛躍，更是開啟了新的應用和可能性。下面將介紹這一變革帶來的三大

#大語言模型 #ChatGPT #深度學習

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 125 | 第五章目錄

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在某些情況下，別人提供的 Pretrained Transformer Model 效果不盡人意，可能會想要自己做 Pretrained Model，但是這會耗費大量運

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 111 | Smoothing 方法

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 110，介紹了 BLEU 使用方法與公式，現在我們再跑一個例子： #Example 3 reference = [['the

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI #ai #PromptEngineering

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM #LLM #大語言模型

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT #AI #人工智慧

王啟樺的沙龍

【大語言模型LLMs：為何「大」字至關重要？】

大語言模型（LLMs）對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。這類模型，如GPT-4，透過其龐大的數據集和複雜的參數設置，提供了前所未有的語言理解和生成能力。那麼，究竟是什麼讓這些模型「大」得如此不同呢？

#大語言模型 #GPT4 #ChatGPT

王啟樺的沙龍

【從規則到革新：3大進步展示了大語言模型在自然語言處理上的威力】

對於熱衷於語言科技的你，大語言模型（LLMs）在自然語言處理（NLP）領域的發展無疑是一個革命性的進展。從傳統的規則系統到基於深度學習的方法， LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。這不僅是技術上的飛躍，更是開啟了新的應用和可能性。下面將介紹這一變革帶來的三大

#大語言模型 #ChatGPT #深度學習