sirmammingtonham/alphastone

📦 オープンソースプロジェクトsirmammingtonham

AlphaZeroの手法とMCTSを組み合わせ、ハースストーンを攻略する深層強化学習エージェント。

AlphaStoneは、チェスや囲碁のような完全情報ゲームとは異なり、隠れた情報が存在する複雑なカードゲーム「ハースストーン」にAlphaZeroの手法を適用する試みです。本プロジェクトでは、不完全情報下での意思決定を可能にするため、情報集合モンテカルロ木探索（ISMCTS）を採用しています。PyTorchで構築された深層ニューラルネットワークがゲーム状態の評価と方策分布を近似し、膨大な自己対戦を通じて人間によるヒューリスティックに頼らない最適戦略の獲得を目指します。本リポジトリは、高分散かつ確率的な環境における状態表現、手札選択、報酬モデリングを学ぶための技術的基盤を提供します。

💡ハイライト

├─AlphaZeroスタイルの自己対戦ループ
├─隠れた状態を扱うISMCTSの実装
└─PyTorchベースのニューラルアーキテクチャ

🎯対象

├─AI研究者
├─強化学習エンジニア
└─ゲームAI開発者

🔗リンク

└─GitHubリポジトリ