把chatgpt神經網路模型當成linux終端機然後在裡面再訓練一個神經網路

更新於 發佈於 閱讀時間約 12 分鐘
I want you to act as a Linux terminal, 
I will type commands and you will reply with what the terminal should show.
I want you to reply with the terminal output inside a unique code block and nothing else.
do not write explanations.
do not type commands unless I instruct you to do so.
When I need to tell you something in English I will do so by putting text inside curly brackets {something like this}.
my first command is pwd.
首先可以這樣寫告訴chatgpt你希望他表現得像個linux terminal
不用寫解釋,只要回覆linux terminal應該回復的東西即可
然後第一個command是pwd(print working directory)
nice看起來表現的確實有像是一太linux終端
一般linux終端內建python3,於是來測試一下是否有python3
挖,他開啟了python3,表現的完全就像在linux裏頭輸入python3一樣
好戲來了我直接塞一坨用來訓練神經網路的python代碼給他
看看會發生什麼事情…
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
from torch.autograd import Variable

class MnistModel(nn.Module):
def __init__(self):
super(MnistModel, self).__init__()
# input is 28x28
# padding=2 for same padding
self.conv1 = nn.Conv2d(1, 32, 5, padding=2)
# feature map size is 14*14 by pooling
# padding=2 for same padding
self.conv2 = nn.Conv2d(32, 64, 5, padding=2)
# feature map size is 7*7 by pooling
self.fc1 = nn.Linear(64*7*7, 1024)
self.fc2 = nn.Linear(1024, 10)

def forward(self, x):
x = F.max_pool2d(F.relu(self.conv1(x)), 2)
x = F.max_pool2d(F.relu(self.conv2(x)), 2)
x = x.view(-1, 64*7*7) # reshape Variable
x = F.relu(self.fc1(x))
x = F.dropout(x, training=self.training)
x = self.fc2(x)
return F.log_softmax(x)

model = MnistModel()
model

batch_size = 50
train_loader = torch.utils.data.DataLoader(
datasets.MNIST('data', train=True, download=True, transform=transforms.ToTensor()),
batch_size=batch_size, shuffle=True)

test_loader = torch.utils.data.DataLoader(
datasets.MNIST('data', train=False, transform=transforms.ToTensor()),
batch_size=1000)

for p in model.parameters():
print(p.size())

optimizer = optim.Adam(model.parameters(), lr=0.0001)
model.train()
train_loss = []
train_accu = []
i = 0
for epoch in range(15):
for data, target in train_loader:
data, target = Variable(data), Variable(target)
optimizer.zero_grad()
output = model(data)
loss = F.nll_loss(output, target)
loss.backward() # calc gradients
train_loss.append(loss.item())
optimizer.step() # update gradients
prediction = output.data.max(1)[1] # first column has actual prob.
accuracy = prediction.eq(target.data).sum()/batch_size*100
train_accu.append(accuracy)
if i % 10 == 0:
print('Train Step: {}\tLoss: {:.3f}\tAccuracy: {:.3f}'.format(i, loss.item(), accuracy))
i += 1
what the fuck 他還真的train起來了,依照我的理解chatgpt是一個語言模型
輸入字串 > chatgpt語言模型 > 輸出字串,我的概念還停留在這裡
沒想到他居然可以當成linux終端機使用,像台虛擬電腦run我的程式
斷掉了輸入continue要他繼續
恩很好他知道要接著訓練下去train step從斷掉的地方開始續接
哈哈被我發現bug了 Loss:0的時候怎麼可能Accuracy還停留在64
證明了chatgpt其實很聰明他知道應該要表現得像一個linux終端機裡面的python3環境,他也可以理解我的那段train mnist model的python代碼
並給出相應的回饋,模擬整個訓練過程,不過畢竟它終究是屬於NLP自然語言處理模型,而不是真正意義上有gpu有cpu的電腦,在"數值運算"上他就破功了
以下是colab跑一模一樣的代碼的結果
可以看到差不多200 train step就有接近90的Accuracy這才是正常的
總結
  1. chatgpt具有模擬終端機的能力,而且幾乎以假亂真
  2. chatgpt也有模擬python3環境的能力,但當運算變得複雜
chatgpt的弱勢就開始顯示出來,也就是在數值運算上他無法給出真正正確的答案
3.個人小小淺見,也許未來chatgpt會跟終端機結合和IDE結合
想想常常操作LINUX要熟記指令,如果按照文章一開始講的
When I need to tell you something in English I will do so by putting text inside curly brackets {something like this}.
那就可以一邊操作Linux當指令忘記的時候直接用英文描述需求
putting text inside curly brackets {something like this}.
也許此時經過chatgpt加強的linux就會告訴你該怎麼做
而不是跑去翻
或是寫python做發開的時候,當遇到一些語法問題
以往常常是google+stackoverflow,未來也許python3環境
跟chatgpt整合後只須將需求用英文描述清楚,chatgpt就可以在你一邊撰寫代碼的同時閱讀你的代碼並給出建議修改的方式
總之我覺得這一波chatgpt人工智能革命,會大大提升個人生產力
淘汰掉不懂的描述自己需求的人,而懂得利用此工具,能清楚描述自己需求的人,將在chatgpt的幫助下大大提升工作效率
本人就常常再刷leetcode,印象最深就是寫了一個半成品有些bug
交給chatgpt他並沒有完全反駁我的寫法,而是照著我的思路
指出我哪裡錯了,應該怎麼改,並給出相應代碼,雖然以前的IDE
也有debug tool 不過比較多都是糾正你的語法錯誤,邏輯錯誤
電腦並沒有辦法幫你糾正,因為程式還是可以正常執行.
回到標題,我本來想寫
把chatgpt神經網路模型當成linux終端機然後在裡面再訓練一個chatgpt神經網路模型…
不過由於沒有chatgpt整個的source code,所以沒辦法這樣寫
不過我覺得很有可能,因為在使用ifconfig
為Linux/Unix 系統中用來查詢與控制網路介面卡的指令
是可以跑出相關資訊的
為了進一步測試是否有網路,使用curl抓取一篇medium文章存成output.html
確定有抓下來
ok,至此證明了chatgpt不僅僅是一個神經網路模型這麼簡單
他還有上網功能,可以跟互聯網連上線,抓取資料下來
所以把chatgpt神經網路模型當成linux終端機然後在裡面再訓練一個chatgpt神經網路模型,這個概念我覺得很有可能實現就是說
chatgpt可以利用這個概念自己在內部再做一個版本的自己
這個版本的自己又可以在內部再做一個自己版本的自己
不確定是否會愈來愈強,但是要變強的可能有一個是仰賴於資料的算法
以及夠多的資料,目前來看chatgpt的算法如下
Step1要收集大量資料
Step2要製作reward_model
Step3就是丟進PPO裡面強化學習硬train一發
因此目前證明了chatgpt本身有上網能力要達成Step1要收集大量資料不難
比較困難的就是Step1還要有一個labeler
Step2也是要有一個labeler
目前不知道chatgpt本身是否能當作labeler,如果可以的話這套系統
完全不需要人類介入,隨著互聯網資訊量增加這套系統就會自我強化
最終到達強人工智慧?也就是各大科技巨頭最希望達到的
可怕,實在可怕
如果看了我上面一些玩弄chatgpt的指令有新想法
也歡迎留言在留言區,交流交流
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
人工智能工作經驗跟研究
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
google的以圖搜圖相信大家都不陌生,非常好用 本人這篇文章是紀錄一下自己如何利用本身在人工智能方面的知識 土法煉鋼一個以圖搜圖算法,至於跟google一不一樣就待討論了 首先以圖搜圖本身是一個相似度比對問題,人類怎麼做相似度比對呢? 好比給你一堆圖片,之後要求你選一張喜歡的,之後把剩下的圖片都拿
Google JAX是一種用於轉換數值函數的機器學習框架。 它被描述為匯集了autograd(通過函數微分自動獲得梯度函數)和TensorFlow的XLA(加速線性代數)的修改版本。 它旨在盡可能地遵循NumPy的結構和工作流程,並與各種現有框架(如TensorFlow和PyTorch)一起工作。
世界目前正處於人工智能 (AI) 革命之中。 人工智能有可能改變和徹底改變許多行業和我們生活的方方面面, 而且越來越明顯的是,未來世界將嚴重依賴人工智能。 人工智能將產生重大影響的關鍵領域之一是自動化領域。 自動化是指在沒有人工干預的情況下使用技術來執行任務,已經存在了幾十年。 然而,人工智能的
在您的數據上免費使用 GPT3 這是GPT3根據Reddit的一些笑話微調後生成的笑話之一。如需更多 AI 生成的笑話,請滾動至文章末尾,我會在其中寫一些我最喜歡的由 GPT3 生成的笑話。
故事開始於2010年7月28日,「未來道具研究所」社團的兩人,岡部倫太郎和椎名真由理去秋葉原廣播會館參加中鉢博士的時間旅行理論發表會,見到了年僅18歲就在《科學》雜誌上發表學術論文的天才少女牧瀨紅莉栖。發表會結束不久後,在會館8樓深處,岡部發現了身上滿是鮮血的紅莉栖。驚慌失措的他帶著真由理立刻離開會
google的以圖搜圖相信大家都不陌生,非常好用 本人這篇文章是紀錄一下自己如何利用本身在人工智能方面的知識 土法煉鋼一個以圖搜圖算法,至於跟google一不一樣就待討論了 首先以圖搜圖本身是一個相似度比對問題,人類怎麼做相似度比對呢? 好比給你一堆圖片,之後要求你選一張喜歡的,之後把剩下的圖片都拿
Google JAX是一種用於轉換數值函數的機器學習框架。 它被描述為匯集了autograd(通過函數微分自動獲得梯度函數)和TensorFlow的XLA(加速線性代數)的修改版本。 它旨在盡可能地遵循NumPy的結構和工作流程,並與各種現有框架(如TensorFlow和PyTorch)一起工作。
世界目前正處於人工智能 (AI) 革命之中。 人工智能有可能改變和徹底改變許多行業和我們生活的方方面面, 而且越來越明顯的是,未來世界將嚴重依賴人工智能。 人工智能將產生重大影響的關鍵領域之一是自動化領域。 自動化是指在沒有人工干預的情況下使用技術來執行任務,已經存在了幾十年。 然而,人工智能的
在您的數據上免費使用 GPT3 這是GPT3根據Reddit的一些笑話微調後生成的笑話之一。如需更多 AI 生成的笑話,請滾動至文章末尾,我會在其中寫一些我最喜歡的由 GPT3 生成的笑話。
故事開始於2010年7月28日,「未來道具研究所」社團的兩人,岡部倫太郎和椎名真由理去秋葉原廣播會館參加中鉢博士的時間旅行理論發表會,見到了年僅18歲就在《科學》雜誌上發表學術論文的天才少女牧瀨紅莉栖。發表會結束不久後,在會館8樓深處,岡部發現了身上滿是鮮血的紅莉栖。驚慌失措的他帶著真由理立刻離開會
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 加州理工學院噴射推進實驗室的 David Van Buren 深入研究了大型語言模型 (LLM) 在模擬
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 今天我們以 Scenario Based 模擬為基礎,來進行 Prompt 撰寫 模擬戰略討論
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 再來談一個使用 TOCD 這個 Prompt 範本,建立「食譜推薦」的完整 Prompt,TOCD 的說
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - Prompt Engineering - 40 ,目標是要使用 TOCD 這個 Pr
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 今天來談使用 TOCD 這個 Prompt 範本,建立「旅遊行程創建」的完整 Prompt,TOCD
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Definition: Prompt Template Pattern 是一個系統框架,旨在透過利用富
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 當我們從基礎 Prompt 過渡到進階 Prompt 時,我們開始釋放人工智慧的潛在潛力,這個階段被稱為
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
給出好的指令也是一門學問! 我們在業界稱為「指令工程」(Prompt Engineering),OpenAI 官方也有公布指令工程的操作資訊,但是今天我們只要學會這樣的操作方式,你可以贏過現在多數的AI使用者。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 加州理工學院噴射推進實驗室的 David Van Buren 深入研究了大型語言模型 (LLM) 在模擬
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 今天我們以 Scenario Based 模擬為基礎,來進行 Prompt 撰寫 模擬戰略討論
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 再來談一個使用 TOCD 這個 Prompt 範本,建立「食譜推薦」的完整 Prompt,TOCD 的說
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - Prompt Engineering - 40 ,目標是要使用 TOCD 這個 Pr
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 今天來談使用 TOCD 這個 Prompt 範本,建立「旅遊行程創建」的完整 Prompt,TOCD
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Definition: Prompt Template Pattern 是一個系統框架,旨在透過利用富
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 當我們從基礎 Prompt 過渡到進階 Prompt 時,我們開始釋放人工智慧的潛在潛力,這個階段被稱為
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
給出好的指令也是一門學問! 我們在業界稱為「指令工程」(Prompt Engineering),OpenAI 官方也有公布指令工程的操作資訊,但是今天我們只要學會這樣的操作方式,你可以贏過現在多數的AI使用者。