vietnh1009/Street-fighter-A3C-ICM-pytorch

📦 ओपन सोर्स प्रोजेक्टvietnh1009

A3C और ICM का उपयोग करके स्ट्रीट फाइटर III में महारत हासिल करने वाला क्यूरियोसिटी-ड्रिवेन रीइन्फोर्समेंट लर्निंग एजेंट।

यह रिपॉजिटरी क्लासिक फाइटिंग गेम स्ट्रीट फाइटर III पर लागू क्यूरियोसिटी-ड्रिवेन रीइन्फोर्समेंट लर्निंग का पायटॉर्च (PyTorch) कार्यान्वयन प्रदान करती है। इसका मुख्य नवाचार इंट्रिन्सिक क्यूरियोसिटी मॉड्यूल (ICM) का एकीकरण है, जो एजेंट को अपना स्वयं का आंतरिक रिवॉर्ड सिग्नल उत्पन्न करने की अनुमति देता है। यह फाइटिंग गेम्स जैसे वातावरण में विशेष रूप से प्रभावी है जहां बाहरी रिवॉर्ड्स दुर्लभ या देरी से मिलते हैं। एजेंट प्रशिक्षण प्रक्रिया को तेज करने के लिए कई वर्कर थ्रेड्स में समानांतर प्रशिक्षण करने हेतु A3C एल्गोरिदम का उपयोग करता है। आर्किटेक्चर में एक फीचर एनकोडर शामिल है जो रॉ गेम फ्रेम्स को एक लेटेंट स्पेस में मैप करता है, जहां ICM अगले स्टेट की भविष्यवाणी करता है। यदि भविष्यवाणी त्रुटि अधिक है, तो एजेंट को 'आंतरिक रिवॉर्ड' मिलता है, जो उसे अपरिचित गेम परिदृश्यों का पता लगाने के लिए प्रोत्साहित करता है। यह दृष्टिकोण दर्शाता है कि कैसे स्व-पर्यवेक्षित भविष्यवाणी जटिल वातावरण में पारंपरिक रिवॉर्ड-आधारित RL की सीमाओं को पार कर सकती है।

💡मुख्य बातें

├─समानांतर प्रशिक्षण हेतु A3C एल्गोरिदम
├─क्यूरियोसिटी-ड्रिवेन अन्वेषण के लिए ICM
└─पायटॉर्च-आधारित गेम स्टेट प्रोसेसिंग

🎯के लिए

├─रीइन्फोर्समेंट लर्निंग शोधकर्ता
└─गेम AI डेवलपर्स

🔗लिंक

└─GitHub रिपॉजिटरी