
sirmammingtonham/alphastone
📦 オープンソースプロジェクトsirmammingtonham
AlphaZeroの手法とMCTSを組み合わせ、ハースストーンを攻略する深層強化学習エージェント。
AlphaStoneは、チェスや囲碁のような完全情報ゲームとは異なり、隠れた情報が存在する複雑なカードゲーム「ハースストーン」にAlphaZeroの手法を適用する試みです。本プロジェクトでは、不完全情報下での意思決定を可能にするため、情報集合モンテカルロ木探索(ISMCTS)を採用しています。PyTorchで構築された深層ニューラルネットワークがゲーム状態の評価と方策分布を近似し、膨大な自己対戦を通じて人間によるヒューリスティックに頼らない最適戦略の獲得を目指します。本リポジトリは、高分散かつ確率的な環境における状態表現、手札選択、報酬モデリングを学ぶための技術的基盤を提供します。
💡ハイライト
- ├─AlphaZeroスタイルの自己対戦ループ
- ├─隠れた状態を扱うISMCTSの実装
- └─PyTorchベースのニューラルアーキテクチャ
🎯対象
- ├─AI研究者
- ├─強化学習エンジニア
- └─ゲームAI開発者