rasbt/reasoning-from-scratch

📚 ट्यूटोरियलrasbt

PyTorch में स्क्रैच से रीज़निंग LLM बनाने का चरण-दर-चरण ट्यूटोरियल।

यह रिपॉजिटरी PyTorch में स्क्रैच से रीज़निंग LLM का विस्तृत कार्यान्वयन प्रदान करती है। बुनियादी बिल्डिंग ब्लॉक्स से शुरू करके, यह उन्नत तकनीकों तक आगे बढ़ती है: चेन-ऑफ-थॉट रीज़निंग, GRPO और RLHF के साथ रीइन्फोर्समेंट लर्निंग, टेस्ट-टाइम कंप्यूट स्केलिंग, और नॉलेज डिस्टिलेशन। प्रत्येक चरण के साथ Jupyter नोटबुक हैं जो सिद्धांत और कोड दोनों समझाते हैं। यह परियोजना शैक्षिक उद्देश्यों के लिए डिज़ाइन की गई है, जिससे शिक्षार्थी आधुनिक रीज़निंग मॉडल (जैसे OpenAI का o1, DeepSeek-R1) को गहराई से समझ सकें। 4,500 से अधिक स्टार्स के साथ इसने AI समुदाय में महत्वपूर्ण लोकप्रियता हासिल की है, जो इसके मूल्य को दर्शाता है।

💡मुख्य बातें

├─चरण-दर-चरण PyTorch नोटबुक
├─चेन-ऑफ-थॉट और RL शामिल
└─4.5k+ स्टार्स, सक्रिय समुदाय

🎯के लिए

├─मशीन लर्निंग इंजीनियर
├─AI शोधकर्ता
└─छात्र

🔗लिंक

└─GitHub रिपॉजिटरी