重啟撲克機器人之路 -9：在不完整資訊的迷霧中摸索

2025/02/07 更新2025/02/07 發佈閱讀 2 分鐘

今天開始研究如何運用手上的200萬筆歷史記錄，這個過程讓我重新思考了整個Project的方向。起初被 AI 提供的幾個建議所吸引，特別是 Reinforcement Learning 和 Q-Learning 這兩個選項。老實說，當下真的被這個想法迷住了 - 想像著只要輸入場景，AI 就能給出最高 EV 的action，這願景實在太誘人。

然而在稍微研究 Deep Q-Learning 後，我逐漸意識到事情沒有想像中簡單。德州撲克本質上是個不完整資訊的遊戲，我們永遠無法看到對手的手牌。這個特性讓 Q-Learning 的獎勵系統變得極其複雜。原本以為 200 萬筆記錄是個龐大的數據集，但考慮到需要德州撲克的變數和特性，這個數量可能還遠遠不夠。

特別讓我困擾的是獎勵系統的設計。在撲克中，你可能做出了一個 +EV 的決定，卻因為短期波動而輸掉籌碼。反之，一個理論上較差的決定可能因為好運而獲勝。要如何在這種高度不確定性中建立一個可靠的獎勵機制？這個問題讓我開始懷疑 Q-Learning 是否適合這個Project。

經過一番思考後，我決定轉向另一個可能更實用的方向：建立對手模型系統。這個想法讓我想起以前用 Hand2Note 研究玩家池的經驗。不同的是，這次我要用 Python 來建構一個能預測對手傾向和範圍機率的模型。具體來說，就是分析在特定場景下，一般玩家會選擇 raise、call 或 fold 的比例，再結合 showdown 時的牌面資訊，建立一個可以推測對手手牌範圍的預測模型，然後再使用類似PyPokerEngine這類的工具來訓練AI。

這個新方向雖然看似不如 AI 決策那麼炫酷，但可能更符合撲克的本質。畢竟撲克不僅是一個數學遊戲，更是一個關於資訊不對稱和決策調整的遊戲。如果能大略預測對手的傾向和範圍，我們就能做出更有針對性的決策。

留言

傑劉的沙龍

3會員

18內容數

傑劉的沙龍的其他內容

2025/03/16

重啟撲克機器人之路 -16：數據庫架構逐漸清晰

記錄了對撲克數據庫程式碼的深入理解，以及如何通過精確的查詢獲得準確的分析結果。通過重新組織action type的分類，讓後續的數據分析變得更加高效。這個數據庫將是撲克機器人專案的重要組成部分，用於建立更精確的對手模型。

2025/03/16

重啟撲克機器人之路 -16：數據庫架構逐漸清晰

2025/03/14

重啟撲克機器人之路 -15：數據庫的深淵與突破

記錄了在建構撲克數據庫過程中遇到的挑戰和收穫。探討了自建系統與現成工具的差異，以及如何確保數據準確性。同時反思了精確表達查詢需求的重要性，以及自建系統潛在的長期價值。

2025/03/14

重啟撲克機器人之路 -15：數據庫的深淵與突破

2025/03/13

重啟撲克機器人之路 - 14：數據庫的轉向

記錄了在撲克機器人開發中從機器學習模型轉向建立自定義數據庫的過程，以及這個策略轉變背後的思考。通過分析真實玩家的行動分布，希望能訓練出更有效的撲克機器人。

2025/03/13

重啟撲克機器人之路 - 14：數據庫的轉向

看更多

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

#創作#創作者推薦#靈感

2026/03/25

小松鼠的演算法樂園

📝⭐回憶殺 python實現賓果(Bingo)連線遊戲可線上玩

賓果的遊戲描述在一個5x5的方陣上隨機填充1~25的數字。玩家(使用者) 和電腦(AI)輪流叫一個號碼，最先占據一整條直線連線的獲勝。就像小時候玩的bingo 賓果連線遊戲一樣! (可以是占據兩條對角線，可以是占據水平直線，可以是占據垂直直線)

#python#做中學python#game

2024/08/12

小松鼠的演算法樂園

📝⭐回憶殺 python實現賓果(Bingo)連線遊戲可線上玩

#python#做中學python#game

2024/08/12

中央棋院

圍棋是人類史上最困難的腦力遊戲

想用古老技藝去思考未來科技？想用人工智能去探求智慧結晶？有何物品可以探索過去跟尋找未來！！！你沒猜錯！答案正是「圍棋」！圍棋是人類史上最困難的腦力遊戲！但在2016年Alphago問世後！圍棋開始變成研究AI跟了解AI的技藝！

2024/07/31

2024/07/31

想增進德州撲克技巧？你應該找教練的4個理由

對入門者而言，最常見的問題其實是「不瞭解自己要學習什麼」

#德州撲克#學習#投資

2023/10/24

下班輕鬆賺的沙龍

想增進德州撲克技巧？你應該找教練的4個理由

對入門者而言，最常見的問題其實是「不瞭解自己要學習什麼」

#德州撲克#學習#投資

2023/10/24

02 teresaxp的沙龍

撲克牌遊戲線上種類一覽，撲克牌遊戲有哪些不容錯過！

撲克牌遊戲有許多種類。撲克牌遊戲種類多樣，讓你挑選。喜歡撲克牌遊戲線上玩嗎？娛樂城提供多款撲克牌遊戲，快來試玩吧！

#撲克牌遊戲線上#撲克牌遊戲有哪些#撲克牌遊戲

2023/07/30

02 teresaxp的沙龍

撲克牌遊戲線上種類一覽，撲克牌遊戲有哪些不容錯過！

撲克牌遊戲有許多種類。撲克牌遊戲種類多樣，讓你挑選。喜歡撲克牌遊戲線上玩嗎？娛樂城提供多款撲克牌遊戲，快來試玩吧！

#撲克牌遊戲線上#撲克牌遊戲有哪些#撲克牌遊戲

2023/07/30

創作者經濟 IMO

墨耘｜一幣一希望，桌上遊戲鏈遊化的想像

如果主要玩家 TA 不是為了 Earn 而來，那麽這些鏈上桌遊的代幣可走一種「人人有機會，但個個沒把握」的不確定獎勵性質⋯⋯

#遊戲#桌遊#桌上遊戲

2023/07/22

創作者經濟 IMO

墨耘｜一幣一希望，桌上遊戲鏈遊化的想像

如果主要玩家 TA 不是為了 Earn 而來，那麽這些鏈上桌遊的代幣可走一種「人人有機會，但個個沒把握」的不確定獎勵性質⋯⋯

#遊戲#桌遊#桌上遊戲

2023/07/22

好奇的小仙人掌的沙龍

Python學習筆記-剪刀!石頭!布!

你一定有玩過猜拳遊戲，但你知道怎麼用Python寫一個猜拳遊戲嗎？今天我要分享一個簡單又好玩的程式碼，讓你可以和電腦對戰！首先，我們要導入random模組，這個模組可以讓我們隨機生成一個數字，代表電腦出的拳。然後，我們要用input函數讓使用者輸入自己出的拳，0代表剪刀，1代表石頭，2代表

2023/07/01

2023/07/01

最近我一直在初心二星徘徊，升不上去。所以我找了一些資料，用「科學」的方式提升實力。

#麻將#日本麻將

2023/05/16

殺手丁丁的沙龍

科學化麻將

最近我一直在初心二星徘徊，升不上去。所以我找了一些資料，用「科學」的方式提升實力。

#麻將#日本麻將

2023/05/16

Wei-Jie Weng的沙龍

不間斷 Python 挑戰 Day 16 - 專題：21點 (Blackjack)

這篇文章將利用之前所學過的一些東西，包括if敘述、串列、while迴圈、函數等等的觀念，來實作一個撲克牌的小遊戲－21點。

#python#blackjack

2021/12/26

Wei-Jie Weng的沙龍

不間斷 Python 挑戰 Day 16 - 專題：21點 (Blackjack)

這篇文章將利用之前所學過的一些東西，包括if敘述、串列、while迴圈、函數等等的觀念，來實作一個撲克牌的小遊戲－21點。

#python#blackjack

2021/12/26

Err500

【Python】重新寫一下撲克牌排組

翻閱了去年面試時候的題目，想想現在自己會用什麼方式重新完成這個題目，也正好最近在看python的typing模組及其他使用，使用物件導向的方式改寫了程式碼。

2021/10/10

2021/10/10

　　遊戲有很多種，也因此衍生出很多分類，只要能夠在桌面上遊玩的遊戲，基本上都可以概括當作是桌遊，從撲克牌到大富翁甚至麻將都能和桌遊沾上一點關係．　　而對於接觸桌遊較久的玩家而言，桌遊則是被依據遊戲類型被分成更多種類，派對遊戲、平衡遊戲、陣營遊戲、策略遊戲、紙牌遊戲等等，有時候一款遊戲會有

2021/09/07

2021/09/07

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News