السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

أود اليوم أن أشارككم مقالاً من DeepSeek بعنوان DeepSeekMath: دفع حدود التفكير الرياضي في نماذج اللغة المفتوحة. يقدم هذا المقال DeepSeekMath 7B، والذي تم تدريبه مسبقًا على DeepSeek-Coder-Base-v1.5 7B استنادًا إلى مجموعة من 120B من الرموز المرتبطة بالرياضيات واللغة الطبيعية وبيانات الكود. حقق النموذج درجة مذهلة بلغت 51.7% في المستوى التنافسي...

تم الكشف عن تقنية DeepSeek-R1: تم تحليل المبادئ الأساسية للورقة وتم الكشف عن مفتاح أداء النموذج الرائد

اليوم سنشارك DeepSeek R1، العنوان: DeepSeek-R1: تحفيز القدرة على التفكير في LLMs عبر التعلم التعزيزي: تحفيز القدرة على التفكير في LLM عبر التعلم التعزيزي. تقدم هذه الورقة الجيل الأول من نماذج التفكير في DeepSeek، DeepSeek-R1-Zero وDeepSeek-R1. تم تدريب نموذج DeepSeek-R1-Zero من خلال التعلم التعزيزي واسع النطاق (RL) دون ضبط دقيق خاضع للإشراف (SFT) كخطوة أولية،...

تفسير ورقة DeepSeek R1 والنقاط الفنية الرئيسية

1 الخلفية خلال مهرجان الربيع، جذبت DeepSeek R1 مرة أخرى اهتمامًا واسع النطاق، وحتى مقال تفسير DeepSeek V3 الذي كتبناه سابقًا أعيد بثه أيضًا وتم مناقشته كثيرًا. على الرغم من وجود العديد من التحليلات وإعادة إنتاج DeepSeek R1، فقد قررنا هنا تجميع بعض ملاحظات القراءة المقابلة. سنستخدم ثلاثة ...

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

إن التكلفة العالية لاستخدام نماذج الذكاء الاصطناعي الكبيرة هي السبب الرئيسي وراء عدم تنفيذ العديد من تطبيقات الذكاء الاصطناعي والترويج لها حتى الآن. إن اختيار الأداء المتطرف يعني تكاليف ضخمة لقوة الحوسبة، مما يؤدي إلى تكاليف استخدام عالية لا يمكن للمستخدمين العاديين قبولها. إن المنافسة على نماذج الذكاء الاصطناعي الكبيرة تشبه الحرب بلا دخان. بعد…

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

أخيرًا، اكتملت عائلة Google Gemini 2.0! فهي تهيمن على المخططات بمجرد إصدارها. وفي خضم الملاحقات والحصار من جانب Deepseek وQwen وo3، أصدرت Google ثلاثة نماذج دفعة واحدة في وقت مبكر من صباح اليوم: Gemini 2.0 Pro وGemini 2.0 Flash وGemini 2.0 Flash-Lite. وفي تصنيفات LMSYS للنماذج الكبيرة، احتل Gemini...

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

أبرز ما يميز وكيل الذكاء الاصطناعي إعادة تشكيل تجربة العميل جيسي تشانغ: كيف يتم إنشاء الوكيل فعليًا؟ وجهة نظرنا هي أنه بمرور الوقت، سيصبح أكثر فأكثر مثل الوكيل القائم على اللغة الطبيعية لأن هذه هي الطريقة التي يتم بها تدريب نماذج اللغة الكبيرة (LLMs). على المدى الطويل، إذا كان لديك وكيل فائق الذكاء يمكنه التعامل مع العديد من المشكلات، فإن هذا يعني أنه سيتمكن من إنشاء وكيل يعتمد على اللغة الطبيعية.

كاتي وود: إن DeepSeek يعمل فقط على تسريع عملية خفض التكاليف؛ وسوف يتغير هيكل السوق المركّز للغاية الذي يمكن مقارنته بالكساد الأعظم

أبرز النقاط المنافسة مع DeepSeek مفيدة للولايات المتحدة كاثي وود: أعتقد أن هذا يُظهِر أن تكلفة الابتكار تتراجع بشكل كبير، وأن هذا الاتجاه بدأ بالفعل. على سبيل المثال، قبل DeepSeek، انخفضت تكلفة تدريب الذكاء الاصطناعي بمقدار 75% سنويًا، وانخفضت تكلفة الاستدلال بمقدار 85% إلى 1.5 تريليون دولار.

أطلقت جوجل ثلاثة نماذج جديدة دفعة واحدة: Gemini-2.0-Pro هو نموذج مجاني، ويتمتع بتقييم ممتاز ويحتل المرتبة الأولى، وهو مناسب للترميز ومعالجة المطالبات المعقدة!

تتسارع قصة Gemini 2.0. فقد قدمت النسخة التجريبية من Flash Thinking في ديسمبر للمطورين نموذجًا عمليًا يتميز بزمن انتقال منخفض وأداء عالٍ. وفي وقت سابق من هذا العام، تم تحديث 2.0 Flash Thinking Experimental في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة. في الأسبوع الماضي، تم تحديث الإصدار التجريبي من Flash Thinking Experimental 2.0 في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة.

DeepSeek TOP17 أفضل البدائل: تحليل شامل (2025)

DeepSeek TOP17 أفضل البدائل: تحليل شامل (2025)

مقدمة في المشهد سريع التطور للذكاء الاصطناعي، برز DeepSeek كنموذج لغوي قوي. يستكشف هذا التحليل الشامل أفضل 17 بديلاً لـ DeepSeek، ويفحص ميزاتها وقدراتها وحالات استخدامها الفريدة. يركز بحثنا على كل من المنصات الدولية والصينية التي توفر تكامل DeepSeek أو قدرات مماثلة. تحليل البدائل الرئيسية 1….

علي كوين 2.5-ماكس يتفوق على DeepSeek-V3! مستخدمو الإنترنت: الذكاء الاصطناعي الصيني يسد الفجوة بسرعة

قبل قليل، تم إضافة طراز محلي آخر إلى قائمة Big Model Arena من علي، وهو Qwen2.5-Max، الذي تفوق على DeepSeek-V3 واحتل المركز السابع في التصنيف العام بإجمالي نقاط 1332. كما تفوق أيضًا على طرازات مثل Claude 3.5 Sonnet وLlama 3.1 405B بضربة واحدة. وبشكل خاص، فهو يتفوق في البرمجة...