Harusame64/desktop-touch-mcp
🔌 MCP सर्वरHarusame64
एआई एजेंटों के लिए उन्नत विंडोज डेस्कटॉप ऑटोमेशन, जो त्रुटियों को कम करने के लिए एंटिटी-आधारित इंटरैक्शन का उपयोग करता है।
desktop-touch-mcp, LLM तर्क और विंडोज डेस्कटॉप वातावरण के बीच की खाई को पाटता है। साधारण X/Y कोऑर्डिनेट क्लिकिंग से आगे बढ़कर, यह टूल एजेंटों को UI तत्वों को अलग-अलग एंटिटी के रूप में देखने और हेरफेर करने की अनुमति देता है। इसमें क्षमताओं का एक व्यापक सूट शामिल है, जिसमें तत्व निरीक्षण के लिए UIA, ब्राउज़र-आधारित ऑटोमेशन के लिए CDP, और कीबोर्ड, माउस, क्लिपबोर्ड तथा टर्मिनल संचालन के लिए प्रत्यक्ष सिस्टम नियंत्रण शामिल हैं।
इसकी मुख्य नवाचारों में स्थिति स्थिरता बनाए रखने के लिए 'एंटिटी लीज', यह सुनिश्चित करने के लिए 'सत्यापित डिलीवरी' कि क्रियाएं OS द्वारा सफलतापूर्वक पंजीकृत हैं, और एजेंटों को संचालन के क्रम को समझने में मदद करने के लिए 'कारणात्मक संदर्भ' शामिल हैं। यह आर्किटेक्चर डेस्कटॉप ऑटोमेशन में 'नाजुकता' की समस्या को हल करने के लिए डिज़ाइन किया गया है, जहाँ छोटे UI बदलाव पारंपरिक स्क्रिप्ट को विफल कर देते हैं। अपनी इंटरैक्शन मेमोरी के साथ, एजेंट पिछले UI राज्यों को ट्रैक कर सकता है, जिससे यह जटिल, बहु-चरणीय डेस्कटॉप वर्कफ़्लो के लिए एक शक्तिशाली उपकरण बन जाता है।
💡मुख्य बातें
- ├─एंटिटी-आधारित UI इंटरैक्शन
- ├─UIA और CDP एकीकरण
- └─सत्यापित डिलीवरी और स्टेट मेमोरी
🎯के लिए
- ├─एआई एजेंट डेवलपर्स
- └─ऑटोमेशन इंजीनियर