vietnh1009/Street-fighter-A3C-ICM-pytorch

📦 オープンソースプロジェクトvietnh1009

A3CとICMを用いた、好奇心駆動型強化学習によるストリートファイターIII攻略エージェント。

本リポジトリは、格闘ゲーム『ストリートファイターIII』に好奇心駆動型強化学習を適用したPyTorch実装です。最大の革新は、エージェントが独自の内的報酬信号を生成する「ICM（Intrinsic Curiosity Module）」の統合にあります。これは、外部報酬が希薄または遅延しがちな格闘ゲームのような環境で特に有効です。エージェントはA3Cアルゴリズムを使用して複数のワーカースレッドで並列学習を行い、学習プロセスを大幅に加速させます。アーキテクチャには、生のゲームフレームを潜在空間にマッピングする特徴エンコーダーが含まれており、ICMが次の状態を予測します。予測誤差が大きい場合、エージェントは「内的報酬」を受け取り、未知のゲームシナリオを探索するよう促されます。このアプローチは、複雑で非定常な環境において、自己教師あり予測がいかに従来の報酬ベースの強化学習の限界を克服できるかを示しています。

💡ハイライト

├─並列学習を実現するA3Cアルゴリズム
├─好奇心駆動型探索のためのICM統合
└─PyTorchベースのゲーム状態処理

🎯対象

├─強化学習研究者
└─ゲームAI開発者

🔗リンク

└─GitHubリポジトリ