السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO
أود اليوم أن أشارككم مقالاً من DeepSeek بعنوان DeepSeekMath: دفع حدود التفكير الرياضي في نماذج اللغة المفتوحة. يقدم هذا المقال DeepSeekMath 7B، والذي تم تدريبه مسبقًا على DeepSeek-Coder-Base-v1.5 7B استنادًا إلى مجموعة من 120B من الرموز المرتبطة بالرياضيات واللغة الطبيعية وبيانات الكود. حقق النموذج درجة مذهلة بلغت 51.7% في المستوى التنافسي...