基於深度學習的 GTP 圍棋(围棋)引擎,KGS 指引文件以及演算法教學。

CGLemon, updated 🕥 2023-02-26 12:00:18

pyDLGO

The simple English tutorial is Here

自從 AlphaGo 打敗世界冠軍後,電腦圍棋儼然變成深度學習的代名詞,讓不少同學對於電腦圍棋有不小的興趣,但實做一個完整的圍棋引擎並不是只有深度學習而已,還包含許許多多枯燥乏味且需花費大量時間的部份,這令多數同學望而怯步。dlgo 實做一個最低要求的圍棋引擎,它包含圍棋的基本演算法、GTP 界面和 SGF 格式解析器,讓同學可以先跳過這些部份,專注於深度學習,體驗電腦圍棋的魅力。最終目標是希望幫助同學製造屬於自己的圍棋引擎,並參加 TCGA 電腦對局競賽。

(黑) dlgo-0.1 vs (白) Leela-0.11 (黑中盤勝)

vs_leela

使用 Sabaki 分析


Sabaki Analysis

快速開始

開始前請先安裝以下的 python 依賴庫(請注意本程式使用 python3) 1. PyTorch(1.x 版本,如果要使用 GPU 請下載對應的 CUDA/cuDNN 版本) 2. NumPy 3. Tkinter

請輸入下列指令安裝,或自行使用下載可執行的版本

pip3 install -r requirements.txt

完成依賴庫安裝後,首先請先下載本程式碼和預先訓練好的權重,預先訓練好的權重可到 Release 裡找到(為 pt 檔,不需要解壓縮),將權重放到 pyDLGO 的資料夾裡,假設權重的名稱為 nn_2x64.pt ,請輸入以下指令打開圖形界面

$ python3 dlgo.py --weights nn_2x64.pt --gui

文件目錄

  1. 圍棋規則的簡單介紹
  2. 完整的操作教學和 TCGA 比賽
  3. 演算法實做和原理(持續施工中)
  4. GTP 界面原理
  5. SGF 格式說明
  6. board.py 內的 functions
  7. Python 圍棋引擎列表(歡迎添加)

License

本程式為 MIT License ,部份程式有各自的 License ,分別為

Todo

  • 新增 UEC 的比賽資訊
  • 修復 GUI 的 bug 並優化之
  • 實做 AlphaGo Zero pipe?

聯絡資訊

如果有任何問題或是建議,可以通過 [email protected] 聯繫我。

Issues

你好,我设法让他在windows上和sabaki连接,但是他自己断开了

opened on 2022-03-09 11:58:00 by shengkelong

image

Releases

預先訓練好的十九路權重 2022-09-25 07:02:37

預先訓練好的十九路權重,強度約 10 級,config.py 參數如下

BOARD_SIZE = 19 # The default and max board size. We can reset the value later. KOMI = 7.5 # The default komi. We can reset the value later. USE_GPU = True # Set true will use the GPU automatically if you have one. BLOCK_SIZE = 2 # The network residual block size. BLOCK_CHANNELS = 64 # The number of network residual channels. POLICY_CHANNELS = 8 # The number of value head channels. VALUE_CHANNELS = 4 # The number of policy head channels. INPUT_CHANNELS = 18 # Number of the network input layers. PAST_MOVES = 8 # Number of past moves encoding to the planes. USE_SE = False # Enable Squeeze-and-Excite net struct. USE_POLICY_ATTENTION = False # Enable self-attention net struct.

預先訓練好的小型權重 2021-12-05 12:53:43

預先訓練好的小型權重,使用預設的訓練集和網路大小,無須更改 config.py 即可使用,

CGLemon

Forever fourteen years old.

GitHub Repository

deep-learning mcts weiqi goban baduk alphago game-of-go