ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች
ዛሬ ከDeepSeek የወጣውን DeepSeekMath፡የሒሳብ ማመዛዘን ገደቦችን በክፍት ቋንቋ ሞዴሎች መግፋት የሚል ርዕስ ላካፍላችሁ። ይህ መጣጥፍ DeepSeekMath 7B ያስተዋውቃል፣ እሱም በDeepSeek-Coder-Base-v1.5 7B ላይ በ120B ሂሳብ-ነክ ቶከኖች፣ የተፈጥሮ ቋንቋ እና ኮድ መረጃዎች ስብስብ ላይ ቀድሞ የሰለጠነ ነው። ሞዴሉ በውድድር ደረጃ 51.7% አስደናቂ ነጥብ አስመዝግቧል…