GoodStartLabs/AI_Diplomacy

📦 ओपन सोर्स प्रोजेक्टGoodStartLabs

फ्रंटियर LLMs के लिए एक विशेष बेंचमार्क जो कूटनीति (Diplomacy) के जटिल और रणनीतिक खेल में उनकी क्षमता परखता है।

AI_Diplomacy एक परिष्कृत मूल्यांकन फ्रेमवर्क है जो फ्रंटियर LLMs को 'डिप्लोमेसी' बोर्ड गेम में एक-दूसरे के खिलाफ खड़ा करता है। पारंपरिक बेंचमार्क के विपरीत, जो स्थिर ज्ञान या सरल तर्क पहेलियों पर केंद्रित होते हैं, डिप्लोमेसी के लिए एजेंटों को गैर-शून्य-योग (non-zero-sum) खेलों में महारत हासिल करने, समझौतों पर बातचीत करने और दीर्घकालिक रणनीतिक सुसंगतता बनाए रखने की आवश्यकता होती है। यह रिपॉजिटरी विभिन्न LLMs को गेम इंजन में एकीकृत करने के लिए आवश्यक बुनियादी ढांचा प्रदान करती है, जिससे शोधकर्ताओं को यह देखने का मौका मिलता है कि मॉडल 'युद्ध के कोहरे' और खेल की सामाजिक गतिशीलता को कैसे नेविगेट करते हैं। मुख्य विशेषताओं में एक मजबूत गेम इंजन, एजेंट प्रदर्शन के लिए मानकीकृत मूल्यांकन मेट्रिक्स और मल्टी-मॉडल इंटरैक्शन के लिए समर्थन शामिल है। यह प्रोजेक्ट AI तर्क की सीमाओं को समझने के लिए आवश्यक है, विशेष रूप से उन क्षेत्रों में जिनमें थ्योरी ऑफ माइंड, रणनीतिक छल और दबाव में सहयोगात्मक समस्या-समाधान शामिल है।

💡मुख्य बातें

├─रणनीतिक बातचीत कौशल का परीक्षण
├─दीर्घकालिक योजना का मूल्यांकन
└─मल्टी-एजेंट समन्वय बेंचमार्क

🎯के लिए

├─AI शोधकर्ता
└─मल्टी-एजेंट सिस्टम डेवलपर्स

🔗लिंक

└─GitHub रिपॉजिटरी