DeepSeek 1 এর পেছনের রহস্য | DeepSeekMath এবং GRPO এর বিস্তারিত তথ্য
আজ আমি DeepSeek থেকে একটি প্রবন্ধ শেয়ার করতে চাই, যার শিরোনাম "DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models"। এই প্রবন্ধে DeepSeekMath 7B এর সাথে পরিচয় করিয়ে দেওয়া হয়েছে, যা DeepSeek-Coder-Base-v1.5 7B এর উপর প্রাক-প্রশিক্ষিত, যা 120B গণিত-সম্পর্কিত টোকেন, প্রাকৃতিক ভাষা এবং কোড ডেটার সংগ্রহের উপর ভিত্তি করে তৈরি। প্রতিযোগিতামূলক-স্তরে মডেলটি 51.7% এর একটি আশ্চর্যজনক স্কোর অর্জন করেছে...