DeepSeek 1 के पीछे का रहस्य | DeepSeekMath और GRPO विवरण
आज मैं DeepSeek से एक लेख साझा करना चाहूँगा, जिसका शीर्षक है DeepSeekMath: ओपन लैंग्वेज मॉडल में गणितीय तर्क की सीमाओं को आगे बढ़ाना। यह लेख DeepSeekMath 7B का परिचय देता है, जो 120B गणित-संबंधित टोकन, प्राकृतिक भाषा और कोड डेटा के संग्रह के आधार पर DeepSeek-Coder-Base-v1.5 7B पर पूर्व-प्रशिक्षित है। मॉडल ने प्रतिस्पर्धी-स्तर में 51.7% का आश्चर्यजनक स्कोर हासिल किया…