غير مصنف - Deepseek R1

السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

غير مصنف

السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

أود اليوم أن أشارككم مقالاً من DeepSeek بعنوان DeepSeekMath: دفع حدود التفكير الرياضي في نماذج اللغة المفتوحة. يقدم هذا المقال DeepSeekMath 7B، والذي تم تدريبه مسبقًا على DeepSeek-Coder-Base-v1.5 7B استنادًا إلى مجموعة من 120B من الرموز المرتبطة بالرياضيات واللغة الطبيعية وبيانات الكود. حقق النموذج درجة مذهلة بلغت 51.7% في المستوى التنافسي...

غير مصنف

تم الكشف عن تقنية DeepSeek-R1: تم تحليل المبادئ الأساسية للورقة وتم الكشف عن مفتاح أداء النموذج الرائد

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

اليوم سنشارك DeepSeek R1، العنوان: DeepSeek-R1: تحفيز القدرة على التفكير في LLMs عبر التعلم التعزيزي: تحفيز القدرة على التفكير في LLM عبر التعلم التعزيزي. تقدم هذه الورقة الجيل الأول من نماذج التفكير في DeepSeek، DeepSeek-R1-Zero وDeepSeek-R1. تم تدريب نموذج DeepSeek-R1-Zero من خلال التعلم التعزيزي واسع النطاق (RL) دون ضبط دقيق خاضع للإشراف (SFT) كخطوة أولية،...

غير مصنف

تفسير ورقة DeepSeek R1 والنقاط الفنية الرئيسية

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

1 الخلفية خلال مهرجان الربيع، جذبت DeepSeek R1 مرة أخرى اهتمامًا واسع النطاق، وحتى مقال تفسير DeepSeek V3 الذي كتبناه سابقًا أعيد بثه أيضًا وتم مناقشته كثيرًا. على الرغم من وجود العديد من التحليلات وإعادة إنتاج DeepSeek R1، فقد قررنا هنا تجميع بعض ملاحظات القراءة المقابلة. سنستخدم ثلاثة ...

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

غير مصنف

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

إن التكلفة العالية لاستخدام نماذج الذكاء الاصطناعي الكبيرة هي السبب الرئيسي وراء عدم تنفيذ العديد من تطبيقات الذكاء الاصطناعي والترويج لها حتى الآن. إن اختيار الأداء المتطرف يعني تكاليف ضخمة لقوة الحوسبة، مما يؤدي إلى تكاليف استخدام عالية لا يمكن للمستخدمين العاديين قبولها. إن المنافسة على نماذج الذكاء الاصطناعي الكبيرة تشبه الحرب بلا دخان. بعد…

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

غير مصنف

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أخيرًا، اكتملت عائلة Google Gemini 2.0! فهي تهيمن على المخططات بمجرد إصدارها. وفي خضم الملاحقات والحصار من جانب Deepseek وQwen وo3، أصدرت Google ثلاثة نماذج دفعة واحدة في وقت مبكر من صباح اليوم: Gemini 2.0 Pro وGemini 2.0 Flash وGemini 2.0 Flash-Lite. وفي تصنيفات LMSYS للنماذج الكبيرة، احتل Gemini...

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

غير مصنف

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أبرز ما يميز وكيل الذكاء الاصطناعي إعادة تشكيل تجربة العميل جيسي تشانغ: كيف يتم إنشاء الوكيل فعليًا؟ وجهة نظرنا هي أنه بمرور الوقت، سيصبح أكثر فأكثر مثل الوكيل القائم على اللغة الطبيعية لأن هذه هي الطريقة التي يتم بها تدريب نماذج اللغة الكبيرة (LLMs). على المدى الطويل، إذا كان لديك وكيل فائق الذكاء يمكنه التعامل مع العديد من المشكلات، فإن هذا يعني أنه سيتمكن من إنشاء وكيل يعتمد على اللغة الطبيعية.

غير مصنف

كاتي وود: إن DeepSeek يعمل فقط على تسريع عملية خفض التكاليف؛ وسوف يتغير هيكل السوق المركّز للغاية الذي يمكن مقارنته بالكساد الأعظم

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أبرز النقاط المنافسة مع DeepSeek مفيدة للولايات المتحدة كاثي وود: أعتقد أن هذا يُظهِر أن تكلفة الابتكار تتراجع بشكل كبير، وأن هذا الاتجاه بدأ بالفعل. على سبيل المثال، قبل DeepSeek، انخفضت تكلفة تدريب الذكاء الاصطناعي بمقدار 75% سنويًا، وانخفضت تكلفة الاستدلال بمقدار 85% إلى 1.5 تريليون دولار.

غير مصنف

أطلقت جوجل ثلاثة نماذج جديدة دفعة واحدة: Gemini-2.0-Pro هو نموذج مجاني، ويتمتع بتقييم ممتاز ويحتل المرتبة الأولى، وهو مناسب للترميز ومعالجة المطالبات المعقدة!

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

تتسارع قصة Gemini 2.0. فقد قدمت النسخة التجريبية من Flash Thinking في ديسمبر للمطورين نموذجًا عمليًا يتميز بزمن انتقال منخفض وأداء عالٍ. وفي وقت سابق من هذا العام، تم تحديث 2.0 Flash Thinking Experimental في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة. في الأسبوع الماضي، تم تحديث الإصدار التجريبي من Flash Thinking Experimental 2.0 في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة.

DeepSeek TOP17 أفضل البدائل: تحليل شامل (2025)

غير مصنف

DeepSeek TOP17 أفضل البدائل: تحليل شامل (2025)

بواسطةdeepseeker 6 فبراير 20256 فبراير 2025

مقدمة في المشهد سريع التطور للذكاء الاصطناعي، برز DeepSeek كنموذج لغوي قوي. يستكشف هذا التحليل الشامل أفضل 17 بديلاً لـ DeepSeek، ويفحص ميزاتها وقدراتها وحالات استخدامها الفريدة. يركز بحثنا على كل من المنصات الدولية والصينية التي توفر تكامل DeepSeek أو قدرات مماثلة. تحليل البدائل الرئيسية 1….

غير مصنف

علي كوين 2.5-ماكس يتفوق على DeepSeek-V3! مستخدمو الإنترنت: الذكاء الاصطناعي الصيني يسد الفجوة بسرعة

بواسطةzddeepseeker 5 فبراير 20255 فبراير 2025

قبل قليل، تم إضافة طراز محلي آخر إلى قائمة Big Model Arena من علي، وهو Qwen2.5-Max، الذي تفوق على DeepSeek-V3 واحتل المركز السابع في التصنيف العام بإجمالي نقاط 1332. كما تفوق أيضًا على طرازات مثل Claude 3.5 Sonnet وLlama 3.1 405B بضربة واحدة. وبشكل خاص، فهو يتفوق في البرمجة...