重啟撲克機器人之路 -15:數據庫的深淵與突破

更新於 發佈於 閱讀時間約 3 分鐘
raw-image

今天大部分時間都在鑽研數據庫建構的程式碼,嘗試理解它如何將撲克牌局記錄轉化為結構化的資料庫。老實說,雖然大概掌握了60%的邏輯,但細節處仍有許多迷霧籠罩著我。

程式的核心邏輯其實與我之前用來提取特徵點訓練機器學習模型的代碼類似,只是現在轉向了資料庫的建構。然而,縱使我對SQL有基本認識,表與表之間的關聯(SQL的外鍵邏輯)對我來說還是顯得有些陌生。這就像是知道每個房間的功能,卻不太清楚它們之間的走廊如何相連。

當我開始拿自己建構的數據與Hand2Note產生的統計資料進行對比時,表面上看似相符,但深入特定情境(如小盲位置在14-18大盲籌碼區間的行動分佈)後,卻發現了一些差異。這並不意外,畢竟我的程式還處於初期階段,我對它的理解也還不夠深入,無法進行全面檢查。

其中一個有趣的差異是在all-in的定義上。在Hand2Note中,只有玩家將所有籌碼都推出去才被視為全押;而在我的程式中,即使玩家留下了一點點籌碼(例如推出80%的籌碼),也被歸類為全押。這種細微的差異可能會導致統計結果的偏差。

目前當我需要查詢特定資料點時,由於不熟悉SQL語法,我不得不依賴語言模型為我編寫查詢語句。這帶來了一個不小的挑戰:語言模型確實能依照我的指令生成查詢,但問題在於我常常表達不夠精確。就像今天,我只請求了「小盲位置的行動分佈」,而沒有明確指定是「小盲位置的第一個行動分佈」,這意味著結果中可能混入了小盲在面對BB反應後的行動,而非我真正想要的資訊。

與使用現成工具如Hand2Note相比,這些細節在專業軟體中都已經被考慮周全,用戶只需選擇想要的統計資料即可。而自建系統則要求我思考每一個細節,這確實是一種學習,但也是一種障礙。我需要訓練自己更加細緻地思考每個查詢需求。

儘管如此,我還是看到了自建數據庫的潛力。相較於現成工具的固定框架,自建系統提供了無與倫比的靈活性。例如,對於「幾乎全押」的情況,我可以根據需要自由定義分類標準,而不受限於工具的預設規則。

下一步的關鍵是確保數據庫的準確性,因為這是整個項目的基石。若基礎數據有誤,後續所有分析都將偏離正軌,導致誤導性的結果。一旦確立了準確的數據基礎,我希望能建立一個系統,讓我能瀏覽決策樹的每個節點,繪製出行動頻率和手牌分佈。這將為訓練撲克機器人或學習如何對抗特定類型的玩家提供強大的工具。

在過去,我需要手動收集這些數據,然後自行分析,這不僅耗時耗力,而且常常難以保證準確性。例如,分析手牌分佈時,即使能從Hand2Note獲取一些數據,我還是需要手動將手牌範圍輸入到像Cardrunners EV或Solver這樣的工具中,而這些工具之間又是相互獨立的,整合起來相當費力,最終結果也往往不夠精確。

而透過這個自建且靈活的數據庫,我可以將所有資訊整合在一起,無論是用來尋找對抗特定玩家類型的最佳策略,還是訓練撲克模型,都能更加精確高效。

回顧今天的工作,我意識到有時候選擇較為困難的道路可能會帶來更多收穫。雖然自建系統需要更多的前期投入,但長遠來看,這種靈活性和控制力或許正是突破瓶頸的關鍵。


留言
avatar-img
留言分享你的想法!
avatar-img
傑劉的沙龍
3會員
18內容數
傑劉的沙龍的其他內容
2025/03/16
記錄了對撲克數據庫程式碼的深入理解,以及如何通過精確的查詢獲得準確的分析結果。通過重新組織action type的分類,讓後續的數據分析變得更加高效。這個數據庫將是撲克機器人專案的重要組成部分,用於建立更精確的對手模型。
Thumbnail
2025/03/16
記錄了對撲克數據庫程式碼的深入理解,以及如何通過精確的查詢獲得準確的分析結果。通過重新組織action type的分類,讓後續的數據分析變得更加高效。這個數據庫將是撲克機器人專案的重要組成部分,用於建立更精確的對手模型。
Thumbnail
2025/03/13
記錄了在撲克機器人開發中從機器學習模型轉向建立自定義數據庫的過程,以及這個策略轉變背後的思考。通過分析真實玩家的行動分布,希望能訓練出更有效的撲克機器人。
Thumbnail
2025/03/13
記錄了在撲克機器人開發中從機器學習模型轉向建立自定義數據庫的過程,以及這個策略轉變背後的思考。通過分析真實玩家的行動分布,希望能訓練出更有效的撲克機器人。
Thumbnail
2025/02/23
記錄了在開發過程中與LLM合作的經驗教訓,以及在資料處理和模型設計上的一些思考。特別強調了在開發過程中,有時看似繁瑣的基礎工作反而是最重要的。
Thumbnail
2025/02/23
記錄了在開發過程中與LLM合作的經驗教訓,以及在資料處理和模型設計上的一些思考。特別強調了在開發過程中,有時看似繁瑣的基礎工作反而是最重要的。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
1. 持續學習:學習是提升圍棋水平最重要的一環。閱讀圍棋書籍、觀看專業比賽、參加圍棋課程等都是不錯的方法。選擇一個合適的學習方式,並持之以恆。
Thumbnail
1. 持續學習:學習是提升圍棋水平最重要的一環。閱讀圍棋書籍、觀看專業比賽、參加圍棋課程等都是不錯的方法。選擇一個合適的學習方式,並持之以恆。
Thumbnail
本篇介紹單人遊戲的核心架構與邏輯,涵蓋發牌、抽牌、出牌及遊戲結算等重要步驟。文章也詳細介紹了使用 socket.io 建立連線的過程,並說明如何利用 React Hooks 管理遊戲狀態,提及後端伺服器如何處理玩家加入房間的事件,並簡要介紹了房間資訊的管理,此文將分為多篇進一步介紹遊戲事件部分。
Thumbnail
本篇介紹單人遊戲的核心架構與邏輯,涵蓋發牌、抽牌、出牌及遊戲結算等重要步驟。文章也詳細介紹了使用 socket.io 建立連線的過程,並說明如何利用 React Hooks 管理遊戲狀態,提及後端伺服器如何處理玩家加入房間的事件,並簡要介紹了房間資訊的管理,此文將分為多篇進一步介紹遊戲事件部分。
Thumbnail
想用古老技藝去思考未來科技? 想用人工智能去探求智慧結晶? 有何物品可以探索過去跟尋找未來!!! 你沒猜錯!答案正是「圍棋」! 圍棋是人類史上最困難的腦力遊戲! 但在2016年Alphago問世後! 圍棋開始變成研究AI跟了解AI的技藝!
Thumbnail
想用古老技藝去思考未來科技? 想用人工智能去探求智慧結晶? 有何物品可以探索過去跟尋找未來!!! 你沒猜錯!答案正是「圍棋」! 圍棋是人類史上最困難的腦力遊戲! 但在2016年Alphago問世後! 圍棋開始變成研究AI跟了解AI的技藝!
Thumbnail
願意捨棄一些棋子去換取更好的局面,是棋力進步的一個階段,也是長大後現實生活中能用上的觀念呢!
Thumbnail
願意捨棄一些棋子去換取更好的局面,是棋力進步的一個階段,也是長大後現實生活中能用上的觀念呢!
Thumbnail
我想 這就是圍棋最純粹的樣子吧
Thumbnail
我想 這就是圍棋最純粹的樣子吧
Thumbnail
圍棋的訓練過程,與人對弈是必不可少的,課堂中可以找人下棋,但是課後呢?
Thumbnail
圍棋的訓練過程,與人對弈是必不可少的,課堂中可以找人下棋,但是課後呢?
Thumbnail
本篇文章介紹了區間DP及博弈論Min/Max最佳化的相關概念,以及如何應用這些概念來計算最佳策略進行取石頭遊戲的模擬。文章實際分析了演算法、實用的加速技巧和關鍵知識點。這篇文章對於想要學習區間DP的讀者來說非常有價值。
Thumbnail
本篇文章介紹了區間DP及博弈論Min/Max最佳化的相關概念,以及如何應用這些概念來計算最佳策略進行取石頭遊戲的模擬。文章實際分析了演算法、實用的加速技巧和關鍵知識點。這篇文章對於想要學習區間DP的讀者來說非常有價值。
Thumbnail
在CSS Battle的第153題,我們會使用grid、css選擇器、偽元素等技巧來解決西洋棋盤的排版問題。這篇文章分享了完整的解法,包括選擇器使用、偽元素的應用以及其他排版技巧,並激勵讀者分享自己的解法。
Thumbnail
在CSS Battle的第153題,我們會使用grid、css選擇器、偽元素等技巧來解決西洋棋盤的排版問題。這篇文章分享了完整的解法,包括選擇器使用、偽元素的應用以及其他排版技巧,並激勵讀者分享自己的解法。
Thumbnail
今天是第一次打這麼大的場地,打起來真的很累,因為要一直跑來跑去,但同時也更刺激更好玩了! 規則有很大的差異,和之前玩的規則不一樣,但我比較喜歡這次的規則,因為這樣把別人的盤打到地板上的話就可以交換進攻的人,而且也更需要技巧,所以就不會無腦的丟。 也因為有一對一的規則,所以就很需要默契和阻擋的技巧
Thumbnail
今天是第一次打這麼大的場地,打起來真的很累,因為要一直跑來跑去,但同時也更刺激更好玩了! 規則有很大的差異,和之前玩的規則不一樣,但我比較喜歡這次的規則,因為這樣把別人的盤打到地板上的話就可以交換進攻的人,而且也更需要技巧,所以就不會無腦的丟。 也因為有一對一的規則,所以就很需要默契和阻擋的技巧
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News