開發者的 ChatGPT 提示工程 學習筆記- 2

閱讀時間約 6 分鐘
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers - Guideline】章節的第二段筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。

第二原則 - 給模型思考的時間

也就最有名的 `Let's think step by step`(依步驟思考)這句提示的意思,不過更重要的是對問題解決步驟的拆解(Chain of Thought)

原則一、提供步驟來完成任務

例如將你的任務拆解成:
步驟一: ...
步驟二: ...
步驟三: ...
範例:
執行下方動作: 
1 - 將下方 ``` 內的文字以一個句子的長度做摘要 
2 - 將摘要轉換到法文
3 - 列出法文摘要內的名稱
4 - 輸出含有後方鍵值的 json 物件: french_summary, num_names。

將你的答案以分行分隔。

文字:
```
在一個迷人的村莊裡,兄妹傑克和吉爾踏上了一個任務,要從山頂的井裡打水。
他們爬山時歡唱著,但不幸的是,傑克絆倒在一塊石頭上,然後滾下了山,
吉爾也跟著他。儘管有些瘀傷,兩人還是回到家裡,
受到了家人的慰藉。儘管發生了意外,他們的冒險精神依然不減,並繼續愉快地探索。
```
輸出結果:
範例二
執行下方動作:
1 - 將下方 <> 內的文字以一個句子的長度做摘要
2 - 將摘要轉換到法文
3 - 列出法文摘要內的名稱
4 - 輸出含有後方鍵值的 json 物件: french_summary, num_names。

使用下面的格式:
文字: <要摘要的文字>
摘要: <摘要>
翻譯: <摘要的翻譯>
名稱: <摘要翻譯內的名稱>
輸出 JSON: <Json 格式以 summary, num_names 作為鍵值>

文字:
```
在一個迷人的村莊裡,兄妹傑克和吉爾踏上了一個任務,要從山頂的井裡打水。
他們爬山時歡唱著,但不幸的是,傑克絆倒在一塊石頭上,然後滾下了山,
吉爾也跟著他。儘管有些瘀傷,兩人還是回到家裡,
受到了家人的慰藉。儘管發生了意外,他們的冒險精神依然不減,並繼續愉快地探索。
``
輸出結果:

原則二、在模型直接給出結論前,提供指令讓它理出它的解決方案

下面這個範例更令人印象深刻,先來看它直接反應時錯誤的回覆。
範例:
判斷學生的答案是正確還是錯誤。

問題:
我正在建立一個太陽能發電設施,需要幫助計算財務數據。
- 土地成本為每平方英尺 100 美元。
- 我可以以每平方英尺 250 美元的價格購買太陽能板。
- 我談到了一份維護合同,每年將花費我 100,000 美元的固定費用,
外加每平方英尺需要額外 10 美元。
以每平方英尺的數量作為函數來回答,第一年運營的總成本是多少?
學生的解答:
假設 x 為以平方英尺為單位的安裝面積。
成本:
1. 土地成本:100x
2. 太陽能板成本:250x
3. 維護成本:100,000 + 100x
總成本:100x + 250x + 100,000 + 100x = 450x + 100,000
(注意上方的答案,維護成本是錯誤的,應該是 100,000 + 10x 才對)
ChatGPT 給的答覆:
這樣要求直接給答案,會得到錯誤的判斷,但是如果我們給它整理頭緒的指令,它就會得到正確的答案了。
範例:
你的任務是判斷學生的答案是正確還是錯誤。
請以下方的步驟來判斷:
- 先以你自己的解決方案針對問題做解答
- 然後比較你的解決方式和學生的解決方式來判斷學生的是否正確
在你自己解出問題之前不要決定學生的解決方式的正確與否
使用下方的格式:
問題:
```
問題的描述會在這裏
```

實際的解答:
```
解答的步驟跟你的解決方案在這
```

學生的解答與實際的解答計算後是否相同:
```
是或者否
```

學生的分數:
```
正確或者不正確
```

問題:
```
我正在建立一個太陽能發電設施,需要幫助計算財務數據。
- 土地成本為每平方英尺 100 美元。 
- 我可以以每平方英尺 250 美元的價格購買太陽能板。 
- 我談到了一份維護合同,每年將花費我 100,000 美元的固定費用, 
外加每平方英尺需要額外 10 美元。 
以每平方英尺的數量作為函數來回答,
第一年運營的總成本是多少?  
```
學生的解答: 
```
假設 x 為以平方英尺為單位的安裝面積。
成本: 
1. 土地成本:100x 
2. 太陽能板成本:250x 
3. 維護成本:100,000 + 100x 
總成本:100x + 250x + 100,000 + 100x = 450x + 100,000
```
ChatGPT (GPT4)的回覆:
ChatGPT3.5 的回覆(注意它還是錯的):
(請注意,上方這個提示,ChatGPT3.5 與 ChatGPT4 有不一樣的回覆,所以 GPT4 的邏輯思考更強些是很明顯的,不過也可間接證明: 即使使用了 ChainOfThought 的手法,再加上強如 GPT3.5 的大型語言模型,它的推理能力也是不太可靠。)

模型的限制

ChatGPT 這類大型語言模型最為人詬病的,就是會有講的頭頭是道,但卻是瞎掰的,所謂【幻覺】的現象。我們直接來看一個範例:
跟我說說痞子客出版的拉不拉丁星球這本書
ChatGPT 的回覆:
它回覆的煞有其事,但是這其實一切都只是一個瞎掰的問題。而課程裏面有介紹到一個減少幻覺的方式。就是加上一段【請先尋找相關的資訊再依照相關的資訊來回答問題】的提示,但是經過實際的確認,其實幫助不大,我們和大家分享其中一個ChatGPT(GPT3.5)回答得比較好的範例:
但是相同的,ChatGPT4 回覆的就很精準。即使我們沒有加上【請先尋找相關的資訊再依照相關的資訊來回答問題】這句提示,如下:
為什麼會看到廣告
18會員
19Content count
留言0
查看全部
發表第一個留言支持創作者!
Ted Chen的沙龍 的其他內容
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers】的筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 另外因為篇幅有限,所以我們會將他的第一堂課的內容(Guidelines),拆分成
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
63 個省,嗯...好多啊,可能記得起來嗎?不過開玩笑的,記憶也沒有太多意義,今天和大家分享這影片主要是因為,這影片的取景跟配樂實在是太精彩了 另外這位 Youtuber 其實關注他很久了,很喜歡他表現出來的自豪、熱愛的態度,一定是位很熱愛自己國土的人,才能堅持到現在。 比較可惜的是這部影片沒有字幕
這次看完這影片後,發現了一個蠻有趣的越南網站 - Gody。它是一個專門設計給背包客、自由行旅客的一個旅行工具平台(For 越南人)。大致上行程規劃、旅程經驗分享、甚至交友/語言交換似乎都可能在上面實現? 另外也在想,不知道下次要不要深入了解後跟大家仔細拆解、說明如何使用這個網站呢? 如果有這個興趣
人果然身處在環境中會不自覺的麻痺,看著這越南朋友遊台灣的影片,應該是自己對於台北也過分熟悉吧,所以沒有太多的衝擊。但是看著影片時,不時會出現的【原來越南語是這麼說?】的訝異,倒是有點不一樣的感覺 不過即使太過於熟悉,任何東西深掘下去,果然也是會有平常沒有注意到之處。 關於蚵仔麵線的其他 由於自己還算
最近接獲一個任務,該任務的目標是替一個即將進入正式部署階段的系統,導入一個 database migration tool,以下是此任務整個思考決策的邏輯以及正式進行時技術上比較值得和大家分享的小細節。 系統背景 資料庫的設計方式,目前常見會有兩種方向,code first 以及 database
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers】的筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 另外因為篇幅有限,所以我們會將他的第一堂課的內容(Guidelines),拆分成
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
63 個省,嗯...好多啊,可能記得起來嗎?不過開玩笑的,記憶也沒有太多意義,今天和大家分享這影片主要是因為,這影片的取景跟配樂實在是太精彩了 另外這位 Youtuber 其實關注他很久了,很喜歡他表現出來的自豪、熱愛的態度,一定是位很熱愛自己國土的人,才能堅持到現在。 比較可惜的是這部影片沒有字幕
這次看完這影片後,發現了一個蠻有趣的越南網站 - Gody。它是一個專門設計給背包客、自由行旅客的一個旅行工具平台(For 越南人)。大致上行程規劃、旅程經驗分享、甚至交友/語言交換似乎都可能在上面實現? 另外也在想,不知道下次要不要深入了解後跟大家仔細拆解、說明如何使用這個網站呢? 如果有這個興趣
人果然身處在環境中會不自覺的麻痺,看著這越南朋友遊台灣的影片,應該是自己對於台北也過分熟悉吧,所以沒有太多的衝擊。但是看著影片時,不時會出現的【原來越南語是這麼說?】的訝異,倒是有點不一樣的感覺 不過即使太過於熟悉,任何東西深掘下去,果然也是會有平常沒有注意到之處。 關於蚵仔麵線的其他 由於自己還算
最近接獲一個任務,該任務的目標是替一個即將進入正式部署階段的系統,導入一個 database migration tool,以下是此任務整個思考決策的邏輯以及正式進行時技術上比較值得和大家分享的小細節。 系統背景 資料庫的設計方式,目前常見會有兩種方向,code first 以及 database
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
前端開發者常會遇到需要網頁素材的情況,雖然在公司中都可能有可以配合的平面設計師或是UIUX設計師,但在這個多工高效的時代不免也需要前端開發者也可以處理簡單的設計,也可提升設計審美或與設計師溝通的能力。 然而前端開發者也算是擁有設計師的天賦,透過程式碼來完成平面設計,將網頁的每個介面都視為平面設計,
Thumbnail
大家好,我是專注於Apple應用生態的獨立開發者Melo,这是我在方格子的第一篇文章。 2023年10月我向公司提出辭職,一個月後我全職開始了自己的開發工作。辭職的主要原因是家庭因素,畢竟裸辭創業風險太大了。創業和做生意的差別在於,做生意是在一定時間內賺取最大利潤,我們所見的實體店面、網店、加密貨
Thumbnail
前陣子在跟讀者聊天的時候,發現在 Junior 階段很容易遇到一些工作上挫折,但又不太知道怎麼解決或是優化。 也有可能在開發過程中碰到了些大地雷,但身邊的前輩、同事不一定能用比較軟性的方式好好的傳達,這是非常常出現的,尤其是在跨部門協作經驗較少的工程師,會不曉得怎麼用淺顯易懂的語言告訴⋯⋯
Thumbnail
今天想透過這篇文章與各位分享如何透過 Chrome Devtool 的 Performance Tab 來檢測網頁在執行時的各種效能指標,讓網頁的 Runtime Performance 不再成為你 debug 時的瓶頸!
Thumbnail
我每天都要处理两类事务:简悦 & 工作,每个事务都会有不同的角色,如前者包括:编码、设计、产品经理、客服、售后、商务等,后者大多数时候是乙方角色,所以也包括了产品经理、沟通、估算成本、阶段交付以及「要账」…… 等等。 工作日志(间歇日记) 工作进度 产品动态(奖励机制) 文章协作 子项目 注释
Thumbnail
面对这几十种编辑器,程序员群体和软件开发者应该如何选择呢?下面将选择一些备受好评的代表性产品进行综合测评。 Emacs:神的编辑器 介绍 一个可扩展的、可定制的、自由的编辑器。 📷 特点 极其丰富和强大的插件系统:这是 Emacs 最核心的特征; 高度可定制; 📷 评价 Emacs 官网
Thumbnail
跟很多喜欢 All-in-one 的朋友相反,我非常反对此观点,为此写了 放弃纠结、拥抱妥协,重器轻用就是高效 来聊聊这个误区。 本次想跟大家聊聊我的 Workflowy 使用观,如果你没有注册过 Workflowy,可使用 此邀请链接注册,你和我都会增加 250个节点。 写在前面 📷 📷
Thumbnail
阻撓 web 3 規模化應用的障礙 如果要看見大量的 web 3 marketing 應用案例,web3 領域的 martech 或各項鏈上技術還需要達成幾個關鍵的里程碑才行,而可能需要至少 5 年或更長的時間才能實現。 Web 3 世界裡的 NFTs shopify - Novel
Thumbnail
圖片來自 Shine With Sapphire (本文譯自〈Docker for PHP Developers〉) Docker 和 Vagarant 有什麼不同? 如果在每個專案同時運行多個容器(container)的情況下 Docker 比 Vagrant 好在哪裡?會比用 Vagrant 同
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
前端開發者常會遇到需要網頁素材的情況,雖然在公司中都可能有可以配合的平面設計師或是UIUX設計師,但在這個多工高效的時代不免也需要前端開發者也可以處理簡單的設計,也可提升設計審美或與設計師溝通的能力。 然而前端開發者也算是擁有設計師的天賦,透過程式碼來完成平面設計,將網頁的每個介面都視為平面設計,
Thumbnail
大家好,我是專注於Apple應用生態的獨立開發者Melo,这是我在方格子的第一篇文章。 2023年10月我向公司提出辭職,一個月後我全職開始了自己的開發工作。辭職的主要原因是家庭因素,畢竟裸辭創業風險太大了。創業和做生意的差別在於,做生意是在一定時間內賺取最大利潤,我們所見的實體店面、網店、加密貨
Thumbnail
前陣子在跟讀者聊天的時候,發現在 Junior 階段很容易遇到一些工作上挫折,但又不太知道怎麼解決或是優化。 也有可能在開發過程中碰到了些大地雷,但身邊的前輩、同事不一定能用比較軟性的方式好好的傳達,這是非常常出現的,尤其是在跨部門協作經驗較少的工程師,會不曉得怎麼用淺顯易懂的語言告訴⋯⋯
Thumbnail
今天想透過這篇文章與各位分享如何透過 Chrome Devtool 的 Performance Tab 來檢測網頁在執行時的各種效能指標,讓網頁的 Runtime Performance 不再成為你 debug 時的瓶頸!
Thumbnail
我每天都要处理两类事务:简悦 & 工作,每个事务都会有不同的角色,如前者包括:编码、设计、产品经理、客服、售后、商务等,后者大多数时候是乙方角色,所以也包括了产品经理、沟通、估算成本、阶段交付以及「要账」…… 等等。 工作日志(间歇日记) 工作进度 产品动态(奖励机制) 文章协作 子项目 注释
Thumbnail
面对这几十种编辑器,程序员群体和软件开发者应该如何选择呢?下面将选择一些备受好评的代表性产品进行综合测评。 Emacs:神的编辑器 介绍 一个可扩展的、可定制的、自由的编辑器。 📷 特点 极其丰富和强大的插件系统:这是 Emacs 最核心的特征; 高度可定制; 📷 评价 Emacs 官网
Thumbnail
跟很多喜欢 All-in-one 的朋友相反,我非常反对此观点,为此写了 放弃纠结、拥抱妥协,重器轻用就是高效 来聊聊这个误区。 本次想跟大家聊聊我的 Workflowy 使用观,如果你没有注册过 Workflowy,可使用 此邀请链接注册,你和我都会增加 250个节点。 写在前面 📷 📷
Thumbnail
阻撓 web 3 規模化應用的障礙 如果要看見大量的 web 3 marketing 應用案例,web3 領域的 martech 或各項鏈上技術還需要達成幾個關鍵的里程碑才行,而可能需要至少 5 年或更長的時間才能實現。 Web 3 世界裡的 NFTs shopify - Novel
Thumbnail
圖片來自 Shine With Sapphire (本文譯自〈Docker for PHP Developers〉) Docker 和 Vagarant 有什麼不同? 如果在每個專案同時運行多個容器(container)的情況下 Docker 比 Vagrant 好在哪裡?會比用 Vagrant 同