如何透過文字描述修改AI權重？

EC3

發佈於3D建模

更新於 2025/02/04發佈於 2025/02/04閱讀時間約 2 分鐘

AI權重的視覺層次圖

要透過文字描述來更改AI權重，我們需要先理解AI模型的架構和權重的含義。

AI模型，尤其是神經網絡，由多層神經元組成，每層神經元之間的連接都有相應的權重。這些權重決定了模型如何處理輸入數據並產生輸出。

我們需要設計一個機制，將這些解析出的意圖轉化為對模型權重的具體更改，這個步驟通常需要掌握一些基本的機器學習概念和技術，包括：模型訓練、損失函數、權重調整等。

以下是一些基本步驟和概念：

定義問題：首先需要清楚定義問題，確定AI模型的輸入和輸出，以及模型需要學習的目標。

選擇模型：選擇適合問題的機器學習模型。常見的模型包括線性回歸、神經網絡、決策樹等。

設置損失函數：損失函數是衡量模型預測結果與真實結果之間差異的指標。常見的損失函數包括均方誤差（MSE）、交叉熵（Cross-Entropy）等。

調整權重：在訓練模型的過程中，通過反向傳播算法（Backpropagation）來調整模型的權重，使得損失函數的值最小化。這一過程通常涉及到梯度下降法（Gradient Descent）等優化算法。

超參數調整：超參數是指模型訓練過程中的一些參數，例如學習率（Learning Rate）、批量大小（Batch Size）等。這些參數會影響模型的訓練效果，通常需要通過實驗來調整。

驗證和測試：在模型訓練完成後，需要通過驗證集和測試集來評估模型的性能，確保模型在未見過的數據上具有良好的泛化能力。

留言

留言分享你的想法！

❦ 莊小昕

2025/02/04

謝謝EC分享！說得好細緻！👍👍

EC3

發文者

2025/02/04

❦ 莊小昕不客氣。希望有幫助到有在寫Prompt的讀者。 AI出現很多版本，我後來是選擇與過去開發遊戲軟體觀念比較接近來分享。不同領域的AI模型應該多多少少不太一樣。也是幫自己複習一下觀念。

EC3

297會員

389內容數

圖生文、文生文、文生圖、圖生圖

EC3的其他內容

2025/04/29

透明樹脂中文字

Prompt: 生成2個3D漢字符號「混色」的楷書藝術化表達，由光滑圓潤的透明樹酯與乾燥花材質製成，具有精緻光澤，排列在淡灰色背景上。根據「混色」2字的正確意思，正確的筆順動畫，下筆位置，正確的部首間架結構，正確的筆劃粗細、長短、大小、角度、輕重、比例，將這2個字雕刻出來。工具：Chatgp

2025/04/29

透明樹脂中文字

2025/04/28

「心如工畫師」五字

Prompt: 生成5個3D繁體漢字符號「心如工畫師」的楷書藝術化表達，由光滑圓潤的白玉材質製成，具有精緻光澤，排列在淡灰色背景上。根據「心如工畫師」5字的正確意思，正確的筆順動畫，下筆位置，正確的部首間架結構，正確的筆劃粗細、長短、大小、角度、輕重、比例，將這5個字雕刻出來。工具：Cha

2025/04/28

「心如工畫師」五字

2025/04/27

Ｍio在客廳試鋼琴

Prompt: 把單色背景換成客廳。工具：豆包

2025/04/27

Ｍio在客廳試鋼琴

Prompt: 把單色背景換成客廳。工具：豆包

#創作的其他內容

神仙打架的2000年代華語樂壇！他們也曾經寫歌給她！孫燕姿篇

方格子 vocus 官方沙龍

📣 我的媽呀！5 月發燒話題登場，一起來寫媽的故事 ♥️

縱光故事屋

【寫作人生】因為母親，我才繼續寫小說

你可能也想看

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

大家好，我是一名眼科醫師，也是一位孩子的媽身為眼科醫師的我，我知道視力發展對孩子來說有多關鍵。每到開學季時，診間便充斥著許多憂心忡忡的家屬。近年來看診中，兒童提早近視、眼睛疲勞的案例明顯增加，除了3C使用過度，最常被忽略的，就是照明品質。然而作為一位媽媽，孩子能在安全、舒適的環境

#momo購物網#Philips飛利浦#軒博

2025/04/30

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

#momo購物網#Philips飛利浦#軒博

2025/04/30

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

我的「媽」呀！母親節即將到來，vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常，或是一直想對她表達的感謝，又或者，是你這輩子最想聽她說出的一句話。也歡迎你曬出合照，分享照片背後的點點滴滴 ♥️ 透過創作，將這份情感表達出來吧！🥹

#母親節#媽媽美照#媽媽日常

2025/05/01

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

#母親節#媽媽美照#媽媽日常

2025/05/01

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 115 | Google Trax 載入預訓練權重

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。現在我們來載入預訓練權重，預訓練的權重包含 Transformer 的智慧

#AI#ai#promptengineering

2024/08/05

Learn AI 不 BI

AI說書 - 從0開始 - 115 | Google Trax 載入預訓練權重

#AI#ai#promptengineering

2024/08/05

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

延續上一篇訓練GAM模型，這次我們讓神經網路更多層更複雜一點，來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇資料集分割處理的部分在延續上篇文章，從第五點開始後修改即可，前面都一樣訓練過程，比較圖是不是CNN的效果比MLP還要好，

#CNN的GAN模型#Python#深度學習

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

#CNN的GAN模型#Python#深度學習

2024/07/26

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 86

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 84

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 42

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在AI說書 - 從0開始 - 41中，我們提及 Transformer 的 Encoder 架構如下圖所示，同時我們羅列幾個要點於圖示右邊：原始 Transform

#AI#ai#PromptEngineering

2024/06/23

Learn AI 不 BI

AI說書 - 從0開始 - 42

#AI#ai#PromptEngineering

2024/06/23

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

#ChatGPT#AI#人工智慧

2024/02/24

Karen的沙龍

機器學習實用技巧：用多進程加速你的特徵工程

在數據科學和機器學習中，特徵工程是提高模型性能的關鍵步驟之一，通過創建新特徵或轉換現有特徵，我們可以更好地捕捉數據中的信息，提高模型的預測能力。然而，當處理大數據集時，特徵工程可能變得耗時，而且若是在研發階段，特徵其實是需要快速迭代去產生並且做後續的實驗，這也是近期遇到的問題，因此想在這篇文章實作多

#數據#學習#資料科學

2023/10/30