vietnh1009/Super-mario-bros-PPO-pytorch

📦 オープンソースプロジェクトvietnh1009

PyTorchでスーパーマリオブラザーズをプレイするエージェントを訓練するPPOアルゴリズム。

リポジトリ「vietnh1009/Super-mario-bros-PPO-pytorch」は、古典的なゲーム「スーパーマリオブラザーズ」に適用された近位政策最適化（PPO）強化学習アルゴリズムのオープンソース実装です。PyTorchとOpenAI Gymで構築されており、環境ラッパー、ニューラルネットワークアーキテクチャ（CNNベースの政策ネットワークと価値ネットワーク）、訓練ループを含む完全な訓練パイプラインを提供します。コードはモジュール化され、十分に文書化されており、教育目的やさらなる強化学習研究のベースラインとして適しています。訓練モードと評価モードの両方をサポートし、ゲームプレイのレンダリングオプションも備えています。このプロジェクトはGitHubでの人気に示されるように、強化学習コミュニティで広く採用されています。

💡ハイライト

├─PyTorchによるPPO実装
├─OpenAI Gym スーパーマリオ環境
└─1,295 GitHubスター

🎯対象

├─強化学習研究者
├─ゲームAI開発者
└─PyTorch学習者

🔗リンク

└─GitHubリポジトリ