傑劉的沙龍

重啟撲克機器人之路 -9：在不完整資訊的迷霧中摸索

更新於 2025/02/07發佈於 2025/02/07閱讀時間約 2 分鐘

raw-image

今天開始研究如何運用手上的200萬筆歷史記錄，這個過程讓我重新思考了整個Project的方向。起初被 AI 提供的幾個建議所吸引，特別是 Reinforcement Learning 和 Q-Learning 這兩個選項。老實說，當下真的被這個想法迷住了 - 想像著只要輸入場景，AI 就能給出最高 EV 的action，這願景實在太誘人。

然而在稍微研究 Deep Q-Learning 後，我逐漸意識到事情沒有想像中簡單。德州撲克本質上是個不完整資訊的遊戲，我們永遠無法看到對手的手牌。這個特性讓 Q-Learning 的獎勵系統變得極其複雜。原本以為 200 萬筆記錄是個龐大的數據集，但考慮到需要德州撲克的變數和特性，這個數量可能還遠遠不夠。

特別讓我困擾的是獎勵系統的設計。在撲克中，你可能做出了一個 +EV 的決定，卻因為短期波動而輸掉籌碼。反之，一個理論上較差的決定可能因為好運而獲勝。要如何在這種高度不確定性中建立一個可靠的獎勵機制？這個問題讓我開始懷疑 Q-Learning 是否適合這個Project。

經過一番思考後，我決定轉向另一個可能更實用的方向：建立對手模型系統。這個想法讓我想起以前用 Hand2Note 研究玩家池的經驗。不同的是，這次我要用 Python 來建構一個能預測對手傾向和範圍機率的模型。具體來說，就是分析在特定場景下，一般玩家會選擇 raise、call 或 fold 的比例，再結合 showdown 時的牌面資訊，建立一個可以推測對手手牌範圍的預測模型，然後再使用類似PyPokerEngine這類的工具來訓練AI。

這個新方向雖然看似不如 AI 決策那麼炫酷，但可能更符合撲克的本質。畢竟撲克不僅是一個數學遊戲，更是一個關於資訊不對稱和決策調整的遊戲。如果能大略預測對手的傾向和範圍，我們就能做出更有針對性的決策。

傑劉的沙龍

2會員

12內容數

留言0

查看全部

發表第一個留言支持創作者！

傑劉的沙龍的其他內容

重啟撲克機器人之路 -8：當效率反而成為陷阱

記錄了在開發撲克機器人時，從對機器學習模型的成功驗證，到意識到自己又回到solver策略老路的過程。最終決定改變方向，轉向分析實戰數據的心路歷程。

#開發 #機器人 #python

重啟撲克機器人之路 -7 ：放棄大型語言模型

記錄了放棄使用大型語言模型作為撲克機器人核心的決定過程，以及新的混合策略方案的構思。文章探討了技術選擇的考量因素，並回顧了過去開發經驗帶來的啟發。

#python #開發 #機器人

重啟撲克機器人之路 -6 ：語言模型會玩德州撲克嗎？

記錄了在開發撲克牌AI時，從機器學習到大型語言模型的技術選擇過程，以及對各種可能解決方案的思考與權衡。

#機器人 #開發 #python

重啟撲克機器人之路 -5 ：再度因爲想省事結果繞了一大圈

記錄了在開發撲克牌辨識系統時遇到的按鈕辨識挑戰，以及從中學到的debug思維和版本控制重要性。文章分享了技術解決方案的演進過程，也反思了個人開發習慣需要改進的地方。

#機器人 #開發 #python

重啟撲克機器人之路 -4 ：當簡單反而是答案

探討了在開發過程中過度依賴AI解決方案的問題，以及如何在專案開發和技術學習之間取得平衡。通過一個簡單的OCR問題，體會到有時最基本的方法反而是最有效的解決方案。

#機器人 #開發 #python

重啟撲克機器人之路 -3 ：從OCR到程式碼重構的一天

分享在撲克桌況辨識project中，從OCR文字辨識到程式碼重構的過程，以及如何在技術實作中尋找平衡點的心得。

#開發 #機器人 #python

重啟撲克機器人之路 -8：當效率反而成為陷阱

記錄了在開發撲克機器人時，從對機器學習模型的成功驗證，到意識到自己又回到solver策略老路的過程。最終決定改變方向，轉向分析實戰數據的心路歷程。

#開發 #機器人 #python

重啟撲克機器人之路 -7 ：放棄大型語言模型

記錄了放棄使用大型語言模型作為撲克機器人核心的決定過程，以及新的混合策略方案的構思。文章探討了技術選擇的考量因素，並回顧了過去開發經驗帶來的啟發。

#python #開發 #機器人

重啟撲克機器人之路 -6 ：語言模型會玩德州撲克嗎？

記錄了在開發撲克牌AI時，從機器學習到大型語言模型的技術選擇過程，以及對各種可能解決方案的思考與權衡。

#機器人 #開發 #python

重啟撲克機器人之路 -5 ：再度因爲想省事結果繞了一大圈

記錄了在開發撲克牌辨識系統時遇到的按鈕辨識挑戰，以及從中學到的debug思維和版本控制重要性。文章分享了技術解決方案的演進過程，也反思了個人開發習慣需要改進的地方。

#機器人 #開發 #python

重啟撲克機器人之路 -4 ：當簡單反而是答案

探討了在開發過程中過度依賴AI解決方案的問題，以及如何在專案開發和技術學習之間取得平衡。通過一個簡單的OCR問題，體會到有時最基本的方法反而是最有效的解決方案。

#機器人 #開發 #python

重啟撲克機器人之路 -3 ：從OCR到程式碼重構的一天

分享在撲克桌況辨識project中，從OCR文字辨識到程式碼重構的過程，以及如何在技術實作中尋找平衡點的心得。

#開發 #機器人 #python

你可能也想看

Google News 追蹤

蕾比特の奇想小窩的沙龍

空間設計小教室＿在留白中打造屬於自我的想像空間

身為一個小資女，一日之始在於起床。每天早上起床，最先面對的就是被陽光曝曬的空間場景。如何用既懶散又不失優雅的姿態完美的伸個懶腰後踮腳下床，著實是門學問。重點不在於自己那一席披頭散髮，也不是因為打呵欠而扭曲的容顏。而是在於陽光滲進空間的角度與濃度。不能太多，直接曝曬像吸血鬼一樣花容

#空間設計 #留白 #光與影

圍棋是人類史上最困難的腦力遊戲

想用古老技藝去思考未來科技？想用人工智能去探求智慧結晶？有何物品可以探索過去跟尋找未來！！！你沒猜錯！答案正是「圍棋」！圍棋是人類史上最困難的腦力遊戲！但在2016年Alphago問世後！圍棋開始變成研究AI跟了解AI的技藝！

#圍棋 #遊戲 #教育

探索圍棋的無限魅力

探索圍棋的無限魅力 —— 提升智慧與人文素養的最佳選擇圍棋，這一源自中國的古老智力遊戲，已有數千年的歷史。它不僅是一種極富挑戰性的策略遊戲，更是一門深具文化內涵的藝術。來到中央棋院，讓我們一起探索圍棋的無限魅力！

#圍棋 #遊戲 #教育

顯化法則研究日記

顯化法則研究日記 (15) 人生賽局

我一直都很喜歡需要動腦的遊戲，因此最近深陷於德州撲克的魅力中無法自拔今天，為了消磨陪伴男友唸書的時間，我從圖書館拿了一本標題為《人生賽局》的書作者為一位哈佛畢業的心理學家，為了了解人們在自我控制及機率、運氣相關事件發生時的心態，因此給自己一年的時間，向頂尖撲克大師學習撲克

#顯化 #賽局 #撲克

你準備好挑戰大腦極限了嗎？

讓你的大腦像火箭一樣起飛！在我們的課程中，你將發現圍棋的魔法，從掌握基本知識到制定複雜策略。我們的老師將用有趣的教學方法來啟發你的創造力和決策能力。快來加入我們的團隊，一起在圍棋的世界中尋找冒險和樂趣吧！

#圍棋 #遊戲 #教育

掌握圍地之道：從「拆邊」開始！

學習如何提升子效，不浪費每一手棋的價值，透過精妙的佈局，不僅拓展你的棋界視野，更能在對局中一展長才⚫️⚪️

#圍棋 #遊戲 #教育

圍棋基本功重要嗎?

現今進入了高手人手一機的「AI時代」一每步棋都有最佳解+勝率參考卻仍然要強調基本功為什麼呢？

#圍棋 #遊戲 #教育

一盤棋的過程起起伏伏，時而領先時而落後，領先時需力求穩健，邁向成功的道路，而落後時就該奮力拚搏，找到逆轉的可能，圍棋高手提高獲勝的機會，往往是冷靜判斷局勢，做出正確的選擇。

#圍棋 #遊戲 #教育

退休教授：慕鐸的沙龍

撲克牌記憶與記憶宮殿

前言上文提及訓練記憶術時常使用撲克牌做為訓練內容，在訓練時首先必須先將每一張的撲克牌轉換成一個圖像，然後以一次翻開兩張撲克牌的方式翻開，並迅速將這兩張圖像聯結在一起，接著將之放置在一個事先規畫好的固定的位置上，如此一一將兩張圖像聯結在一起，並將之放置在不同的位置上，在回憶時，順著位置走一圈就

#撲克牌記憶 #記憶宮殿 #記憶術

god_novel的沙龍

三界短視頻-第6章

成績刷新的通知立即出現在了所有正在操作象棋軟件的玩家的屏幕上，以滾條的方式播放着。雖然這款軟件是專門供玩家與人機對抗的，但卻並非真正意義上的單機遊戲。因爲有排行榜的原因，所以但凡某榜單的第一名被替換，都會進行全服公告。這全服公告一出，所有在玩玩家都不淡定了。 “什麼！5分10秒，這傢伙

前圖紙的沙龍

〈棋〉

#前圖紙 #棋 #完美主義

蕾比特の奇想小窩的沙龍

空間設計小教室＿在留白中打造屬於自我的想像空間

身為一個小資女，一日之始在於起床。每天早上起床，最先面對的就是被陽光曝曬的空間場景。如何用既懶散又不失優雅的姿態完美的伸個懶腰後踮腳下床，著實是門學問。重點不在於自己那一席披頭散髮，也不是因為打呵欠而扭曲的容顏。而是在於陽光滲進空間的角度與濃度。不能太多，直接曝曬像吸血鬼一樣花容

#空間設計 #留白 #光與影

圍棋是人類史上最困難的腦力遊戲

想用古老技藝去思考未來科技？想用人工智能去探求智慧結晶？有何物品可以探索過去跟尋找未來！！！你沒猜錯！答案正是「圍棋」！圍棋是人類史上最困難的腦力遊戲！但在2016年Alphago問世後！圍棋開始變成研究AI跟了解AI的技藝！

#圍棋 #遊戲 #教育

探索圍棋的無限魅力

探索圍棋的無限魅力 —— 提升智慧與人文素養的最佳選擇圍棋，這一源自中國的古老智力遊戲，已有數千年的歷史。它不僅是一種極富挑戰性的策略遊戲，更是一門深具文化內涵的藝術。來到中央棋院，讓我們一起探索圍棋的無限魅力！

#圍棋 #遊戲 #教育

顯化法則研究日記

顯化法則研究日記 (15) 人生賽局

我一直都很喜歡需要動腦的遊戲，因此最近深陷於德州撲克的魅力中無法自拔今天，為了消磨陪伴男友唸書的時間，我從圖書館拿了一本標題為《人生賽局》的書作者為一位哈佛畢業的心理學家，為了了解人們在自我控制及機率、運氣相關事件發生時的心態，因此給自己一年的時間，向頂尖撲克大師學習撲克

#顯化 #賽局 #撲克

你準備好挑戰大腦極限了嗎？

讓你的大腦像火箭一樣起飛！在我們的課程中，你將發現圍棋的魔法，從掌握基本知識到制定複雜策略。我們的老師將用有趣的教學方法來啟發你的創造力和決策能力。快來加入我們的團隊，一起在圍棋的世界中尋找冒險和樂趣吧！

#圍棋 #遊戲 #教育

掌握圍地之道：從「拆邊」開始！

學習如何提升子效，不浪費每一手棋的價值，透過精妙的佈局，不僅拓展你的棋界視野，更能在對局中一展長才⚫️⚪️

#圍棋 #遊戲 #教育

圍棋基本功重要嗎?

現今進入了高手人手一機的「AI時代」一每步棋都有最佳解+勝率參考卻仍然要強調基本功為什麼呢？

#圍棋 #遊戲 #教育

一盤棋的過程起起伏伏，時而領先時而落後，領先時需力求穩健，邁向成功的道路，而落後時就該奮力拚搏，找到逆轉的可能，圍棋高手提高獲勝的機會，往往是冷靜判斷局勢，做出正確的選擇。

#圍棋 #遊戲 #教育

退休教授：慕鐸的沙龍

撲克牌記憶與記憶宮殿

前言上文提及訓練記憶術時常使用撲克牌做為訓練內容，在訓練時首先必須先將每一張的撲克牌轉換成一個圖像，然後以一次翻開兩張撲克牌的方式翻開，並迅速將這兩張圖像聯結在一起，接著將之放置在一個事先規畫好的固定的位置上，如此一一將兩張圖像聯結在一起，並將之放置在不同的位置上，在回憶時，順著位置走一圈就

#撲克牌記憶 #記憶宮殿 #記憶術

god_novel的沙龍

三界短視頻-第6章

成績刷新的通知立即出現在了所有正在操作象棋軟件的玩家的屏幕上，以滾條的方式播放着。雖然這款軟件是專門供玩家與人機對抗的，但卻並非真正意義上的單機遊戲。因爲有排行榜的原因，所以但凡某榜單的第一名被替換，都會進行全服公告。這全服公告一出，所有在玩玩家都不淡定了。 “什麼！5分10秒，這傢伙

前圖紙的沙龍

〈棋〉

#前圖紙 #棋 #完美主義