增強式學習
含有「增強式學習」共 4 篇內容
全部內容
發佈日期由新至舊
風清揚的沙龍
2024/12/08
強化微調(Reinforcement Fine-Tuning)
本文介紹一個研究其提出一種透過接收人類回饋來提高文字生成圖像品質的方法。眾所周知,人類回饋有助於提升文字到圖像生成模型的性能,但傳統方法首先需要學習一個獎勵函數(reward function)來擷取和表達人類的期望,然後根據該獎勵函數改進模型。
#
機器學習
#
人工智慧
#
AI人工智慧
12
留言
咖啡因學習教室
2024/01/31
2024 讓你 8分鐘 懂機器學習: 01 機器學習 vs 人工智慧
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
#
人工智慧
#
生成式AI
#
機器學習
2
留言
無限智慧學院的沙龍
2023/10/26
讓人工智慧取得自我反思的能力-回答正確率大幅提升
作者提出一新框架SELF-RAG,強調了大型語言模型(LMMs)的質量和事實性改進,依據需求自動檢索段落,以反思標記生成和評估內容。SELF-RAG讓LMMs自主決定檢索時機和內容,並使其能評估自身生成。實驗表明SELF-RAG改寫LMMs規則,為自主學習和多任務適應的未來鋪平道路。
#
超高效自主學習法
#
自我反思
#
觀點評論
5
留言
Ted Chen的沙龍
2023/05/31
ChatGPT關鍵技術,GPT 怎麼變成 ChatGPT 的?
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
#
ChatGPT
#
預訓練
#
語言模型
5
留言