zddeepseeker - Deepseek R1 - الصفحة 2 من 3

غير مصنف

تم الكشف عن تقنية DeepSeek-R1: تم تحليل المبادئ الأساسية للورقة وتم الكشف عن مفتاح أداء النموذج الرائد

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

اليوم سنشارك DeepSeek R1، العنوان: DeepSeek-R1: تحفيز القدرة على التفكير في LLMs عبر التعلم التعزيزي: تحفيز القدرة على التفكير في LLM عبر التعلم التعزيزي. تقدم هذه الورقة الجيل الأول من نماذج التفكير في DeepSeek، DeepSeek-R1-Zero وDeepSeek-R1. تم تدريب نموذج DeepSeek-R1-Zero من خلال التعلم التعزيزي واسع النطاق (RL) دون ضبط دقيق خاضع للإشراف (SFT) كخطوة أولية،...

غير مصنف

تفسير ورقة DeepSeek R1 والنقاط الفنية الرئيسية

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

1 الخلفية خلال مهرجان الربيع، جذبت DeepSeek R1 مرة أخرى اهتمامًا واسع النطاق، وحتى مقال تفسير DeepSeek V3 الذي كتبناه سابقًا أعيد بثه أيضًا وتم مناقشته كثيرًا. على الرغم من وجود العديد من التحليلات وإعادة إنتاج DeepSeek R1، فقد قررنا هنا تجميع بعض ملاحظات القراءة المقابلة. سنستخدم ثلاثة ...

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

غير مصنف

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

إن التكلفة العالية لاستخدام نماذج الذكاء الاصطناعي الكبيرة هي السبب الرئيسي وراء عدم تنفيذ العديد من تطبيقات الذكاء الاصطناعي والترويج لها حتى الآن. إن اختيار الأداء المتطرف يعني تكاليف ضخمة لقوة الحوسبة، مما يؤدي إلى تكاليف استخدام عالية لا يمكن للمستخدمين العاديين قبولها. إن المنافسة على نماذج الذكاء الاصطناعي الكبيرة تشبه الحرب بلا دخان. بعد…

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

غير مصنف

يهيمن Gemini 2.0 على المخططات، في حين يبكي DeepSeek V3 بسبب سعره، ويولد بطل جديد فعال من حيث التكلفة!

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أخيرًا، اكتملت عائلة Google Gemini 2.0! فهي تهيمن على المخططات بمجرد إصدارها. وفي خضم الملاحقات والحصار من جانب Deepseek وQwen وo3، أصدرت Google ثلاثة نماذج دفعة واحدة في وقت مبكر من صباح اليوم: Gemini 2.0 Pro وGemini 2.0 Flash وGemini 2.0 Flash-Lite. وفي تصنيفات LMSYS للنماذج الكبيرة، احتل Gemini...

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

غير مصنف

حوار a16z مع الرئيس التنفيذي البالغ من العمر 27 عامًا: يتمتع AI Agent بتأثير رافعة مالية ضخم، وسيتم ربط التسعير على المدى الطويل بتكاليف العمالة

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أبرز ما يميز وكيل الذكاء الاصطناعي إعادة تشكيل تجربة العميل جيسي تشانغ: كيف يتم إنشاء الوكيل فعليًا؟ وجهة نظرنا هي أنه بمرور الوقت، سيصبح أكثر فأكثر مثل الوكيل القائم على اللغة الطبيعية لأن هذه هي الطريقة التي يتم بها تدريب نماذج اللغة الكبيرة (LLMs). على المدى الطويل، إذا كان لديك وكيل فائق الذكاء يمكنه التعامل مع العديد من المشكلات، فإن هذا يعني أنه سيتمكن من إنشاء وكيل يعتمد على اللغة الطبيعية.

غير مصنف

كاتي وود: إن DeepSeek يعمل فقط على تسريع عملية خفض التكاليف؛ وسوف يتغير هيكل السوق المركّز للغاية الذي يمكن مقارنته بالكساد الأعظم

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أبرز النقاط المنافسة مع DeepSeek مفيدة للولايات المتحدة كاثي وود: أعتقد أن هذا يُظهِر أن تكلفة الابتكار تتراجع بشكل كبير، وأن هذا الاتجاه بدأ بالفعل. على سبيل المثال، قبل DeepSeek، انخفضت تكلفة تدريب الذكاء الاصطناعي بمقدار 75% سنويًا، وانخفضت تكلفة الاستدلال بمقدار 85% إلى 1.5 تريليون دولار.

غير مصنف

أطلقت جوجل ثلاثة نماذج جديدة دفعة واحدة: Gemini-2.0-Pro هو نموذج مجاني، ويتمتع بتقييم ممتاز ويحتل المرتبة الأولى، وهو مناسب للترميز ومعالجة المطالبات المعقدة!

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

تتسارع قصة Gemini 2.0. فقد قدمت النسخة التجريبية من Flash Thinking في ديسمبر للمطورين نموذجًا عمليًا يتميز بزمن انتقال منخفض وأداء عالٍ. وفي وقت سابق من هذا العام، تم تحديث 2.0 Flash Thinking Experimental في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة. في الأسبوع الماضي، تم تحديث الإصدار التجريبي من Flash Thinking Experimental 2.0 في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسنة.

غير مصنف

علي كوين 2.5-ماكس يتفوق على DeepSeek-V3! مستخدمو الإنترنت: الذكاء الاصطناعي الصيني يسد الفجوة بسرعة

بواسطةzddeepseeker 5 فبراير 20255 فبراير 2025

قبل قليل، تم إضافة طراز محلي آخر إلى قائمة Big Model Arena من علي، وهو Qwen2.5-Max، الذي تفوق على DeepSeek-V3 واحتل المركز السابع في التصنيف العام بإجمالي نقاط 1332. كما تفوق أيضًا على طرازات مثل Claude 3.5 Sonnet وLlama 3.1 405B بضربة واحدة. وبشكل خاص، فهو يتفوق في البرمجة...

خبر عاجل! كشف باحث DeepSeek عبر الإنترنت: تدريب R1 استغرق أسبوعين إلى ثلاثة أسابيع فقط، وتم ملاحظة تطور قوي لـ R1 zero خلال عطلة رأس السنة الصينية

غير مصنف

خبر عاجل! كشف باحث DeepSeek عبر الإنترنت: تدريب R1 استغرق أسبوعين إلى ثلاثة أسابيع فقط، وتم ملاحظة تطور قوي لـ R1 zero خلال عطلة رأس السنة الصينية

بواسطةzddeepseeker 4 فبراير 20254 فبراير 2025

أخبار عاجلة! كشف باحث DeepSeek عبر الإنترنت: استغرق تدريب R1 أسبوعين إلى ثلاثة أسابيع فقط، وتم ملاحظة تطور قوي لـ R1 zero خلال عطلة رأس السنة الصينية الآن، لاحظنا أن الباحث DeepSeek، دايا جو، رد على أسئلة مستخدمي الإنترنت حول DeepSeek R1 وخطط الشركة للمضي قدمًا. لا يمكننا إلا أن نقول ...

احتل DeepSeek R1 المركز الأول في اختبار الكتابة الإبداعية، وكان o3 المصغر أسوأ من o1 المصغر!

غير مصنف

احتل DeepSeek R1 المركز الأول في اختبار الكتابة الإبداعية، وكان o3 المصغر أسوأ من o1 المصغر!

بواسطةzddeepseeker فبراير 3، 2025فبراير 3، 2025

فازت DeepSeek R1 بالبطولة في الاختبار المعياري لكتابة القصة القصيرة الإبداعية، متجاوزة بنجاح اللاعب المهيمن السابق كلود 3.5 سونيت! اختبار معياري الاختبار المعياري الاختبار المعياري الذي صممه الباحث ليخ مازور ليس مسابقة كتابة عادية. طُلب من كل نموذج ذكاء اصطناعي إكمال 500 قصة قصيرة، وكان على كل قصة أن تدمج بذكاء...