
vietnh1009/Super-mario-bros-PPO-pytorch
📦 オープンソースプロジェクトvietnh1009
PyTorchでスーパーマリオブラザーズをプレイするエージェントを訓練するPPOアルゴリズム。
リポジトリ「vietnh1009/Super-mario-bros-PPO-pytorch」は、古典的なゲーム「スーパーマリオブラザーズ」に適用された近位政策最適化(PPO)強化学習アルゴリズムのオープンソース実装です。PyTorchとOpenAI Gymで構築されており、環境ラッパー、ニューラルネットワークアーキテクチャ(CNNベースの政策ネットワークと価値ネットワーク)、訓練ループを含む完全な訓練パイプラインを提供します。コードはモジュール化され、十分に文書化されており、教育目的やさらなる強化学習研究のベースラインとして適しています。訓練モードと評価モードの両方をサポートし、ゲームプレイのレンダリングオプションも備えています。このプロジェクトはGitHubでの人気に示されるように、強化学習コミュニティで広く採用されています。
💡ハイライト
- ├─PyTorchによるPPO実装
- ├─OpenAI Gym スーパーマリオ環境
- └─1,295 GitHubスター
🎯対象
- ├─強化学習研究者
- ├─ゲームAI開発者
- └─PyTorch学習者