
rasbt/reasoning-from-scratch
📚 ट्यूटोरियलrasbt
PyTorch में स्क्रैच से रीज़निंग LLM बनाने का चरण-दर-चरण ट्यूटोरियल।
यह रिपॉजिटरी PyTorch में स्क्रैच से रीज़निंग LLM का विस्तृत कार्यान्वयन प्रदान करती है। बुनियादी बिल्डिंग ब्लॉक्स से शुरू करके, यह उन्नत तकनीकों तक आगे बढ़ती है: चेन-ऑफ-थॉट रीज़निंग, GRPO और RLHF के साथ रीइन्फोर्समेंट लर्निंग, टेस्ट-टाइम कंप्यूट स्केलिंग, और नॉलेज डिस्टिलेशन। प्रत्येक चरण के साथ Jupyter नोटबुक हैं जो सिद्धांत और कोड दोनों समझाते हैं। यह परियोजना शैक्षिक उद्देश्यों के लिए डिज़ाइन की गई है, जिससे शिक्षार्थी आधुनिक रीज़निंग मॉडल (जैसे OpenAI का o1, DeepSeek-R1) को गहराई से समझ सकें। 4,500 से अधिक स्टार्स के साथ इसने AI समुदाय में महत्वपूर्ण लोकप्रियता हासिल की है, जो इसके मूल्य को दर्शाता है।
💡मुख्य बातें
- ├─चरण-दर-चरण PyTorch नोटबुक
- ├─चेन-ऑफ-थॉट और RL शामिल
- └─4.5k+ स्टार्स, सक्रिय समुदाय
🎯के लिए
- ├─मशीन लर्निंग इंजीनियर
- ├─AI शोधकर्ता
- └─छात्र