
vietnh1009/Street-fighter-A3C-ICM-pytorch
📦 オープンソースプロジェクトvietnh1009
A3CとICMを用いた、好奇心駆動型強化学習によるストリートファイターIII攻略エージェント。
本リポジトリは、格闘ゲーム『ストリートファイターIII』に好奇心駆動型強化学習を適用したPyTorch実装です。最大の革新は、エージェントが独自の内的報酬信号を生成する「ICM(Intrinsic Curiosity Module)」の統合にあります。これは、外部報酬が希薄または遅延しがちな格闘ゲームのような環境で特に有効です。エージェントはA3Cアルゴリズムを使用して複数のワーカースレッドで並列学習を行い、学習プロセスを大幅に加速させます。アーキテクチャには、生のゲームフレームを潜在空間にマッピングする特徴エンコーダーが含まれており、ICMが次の状態を予測します。予測誤差が大きい場合、エージェントは「内的報酬」を受け取り、未知のゲームシナリオを探索するよう促されます。このアプローチは、複雑で非定常な環境において、自己教師あり予測がいかに従来の報酬ベースの強化学習の限界を克服できるかを示しています。
💡ハイライト
- ├─並列学習を実現するA3Cアルゴリズム
- ├─好奇心駆動型探索のためのICM統合
- └─PyTorchベースのゲーム状態処理
🎯対象
- ├─強化学習研究者
- └─ゲームAI開発者