مقارنة شاملة بين الإصدار الجديد من OpenAI o3-mini وDeepSeek R1

أصدرت OpenAI أحدث نماذجها الاستدلالية, س3-ميني، والتي تم تحسينها لمجالات مثل العلوم والرياضيات والبرمجة، مما يوفر استجابة أسرع ودقة أعلى وتكلفة أقل.

مقارنةً بسابقه o1-mini، فقد حسّن o3-mini من قدراته الاستدلالية بشكل ملحوظ، خاصةً في حل المشكلات المعقدة. يفضل المختبِرون إجابات o3-mini بمقدار 56%، وانخفض معدل الخطأ بمقدار 39%. من اليوم دردشةGPT بلس، فريق و محترف يمكن للمستخدمين استخدام o3-mini، و مستخدمون مجاني أيضاً تجربة بعض ميزاته.

مقارنة بالنموذج الاستدلالي DeepSeek-R1، كم هو أفضل بكثير OpenAI o3-mini من R1؟

ستقدم هذه المقالة أولاً لمحة عامة عن أبرز ميزات o3-mini، ثم سنستخرج البيانات من كلا الجانبين على كل معيار ونقوم بعمل رسم بياني لمقارنتها بصريًا. بالإضافة إلى ذلك، سنقارن أيضًا سعر o3-mini.

جدول المحتويات

الملامح الأساسية

1.تحسين العلوم والتكنولوجيا والهندسة والرياضيات:: تتفوق في مجالات الرياضيات والبرمجة والعلوم وما إلى ذلك، ولا سيما التفوق على o1-mini في وضع الجهد الاستدلالي العالي.

2.وظائف المطور:: يدعم وظائف مثل استدعاءات الدوال، والإخراج المنظم، ورسائل المطورين لتلبية احتياجات بيئة الإنتاج.

3.استجابة سريعة:: 24% أسرع من o1-mini، مع زمن استجابة يبلغ 7.7 ثانية لكل طلب.

4.التحسينات الأمنية:: يضمن إخراجًا آمنًا وموثوقًا من خلال تقنية المحاذاة العميقة.

5.فعالة من حيث التكلفة:: تسير قدرات الاستدلال وتحسين التكلفة جنبًا إلى جنب، مما يقلل إلى حد كبير من عتبة استخدام الذكاء الاصطناعي.

قارن

الذكاء الاصطناعي المفتوح من أجل إبراز فئته، فإن المدونة الرسمية فقط بمقارنتها بنماذجها الخاصة. لذلك، هذه المقالة عبارة عن جدول مستخرج من ورقة DeepSeek R1 والبيانات من مدونة OpenAI الرسمية.

يقارن OpenAI رسمياً س3-ميني في قائمة الإصدارات، وتقسيمها إلى ثلاثة إصدارات: منخفضة ومتوسطة وعالية، والتي تشير إلى قوة الاستدلال. نظرًا لأن DeepSeek يستخدم Math-500 و OpenAI يستخدم مجموعة بيانات Math، فقد تمت إزالة هذه المقارنة هنا.

الرسم البياني أكثر سهولة، وتمت إزالة Codeforces لأن القيم كبيرة جدًا بحيث لا يمكن عرضها بشكل بديهي. ومع ذلك، تُظهر المقارنة على Codeforces أن قوة الاستدلال العالية لـ o3-mini ليست متقدمة كثيرًا.

↑1AIME2024 →2GPQA Diamond →3MMLU →4SWE-المقياس-المتحقق من صحة AIME2024 →2GPQA Diamond →3MMLU →4SWE-المقياس-المتحقق من صحة

من الرسم البياني، هناك ما مجموعه 4 مقارنات، ويتصدر O3-mini (مرتفع) بشكل عام، ولكن الصدارة صغيرة جدًا.

السعر

الطراز	سعر المدخلات	إصابة ذاكرة التخزين المؤقت	سعر المخرجات
س3-ميني	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
ديبسيك R1	$0.55	$0.14	$2.19

الملخص

مع تسبب DeepSeek R1 في إثارة ذعر DeepSeek في الولايات المتحدة، كان أول من شعر بالتهديد هو OpenAI، وهو ما يتضح بشكل خاص في تسعير طرازها الجديد o3-mini.

عندما تم إصدار Openai o1 لأول مرة، شكل سعره المرتفع ضغطًا على العديد من المطورين والمستخدمين. ظهور DeepSeek R1 أعطى الجميع المزيد من الخيارات.من فرق السعر الذي يبلغ 30 ضعفًا بين o1 وR1 إلى السعر النهائي لـ o3-mini الذي يبلغ ضعف سعر DeepSeek R1,

يُظهر تأثير DeepSeek R1 على Openai.ومع ذلك، لا يمكن لمستخدمي ChatGPT المجاني إلا تجربة o3-mini بشكل محدود، في حين أن خاصية التفكير العميق DeepSeek متاحة حاليًا لجميع المستخدمين.أتطلع أيضًا إلى أن تقدم Openai المزيد من نماذج الذكاء الاصطناعي الرائدة مع تقليل تكلفة الاستخدام للمستخدمين.

من من منظور التجربة الشخصية للمدون في استخدام R1، أود أن أقول إن التفكير العميق لـ R1 يفتح ذهني دائمًا. أوصي الجميع باستخدامه أكثر للتفكير في المشاكل~

غير مصنف

أصدر DeepSeek الكود المصدري الخاص به، وشرحًا تفصيليًا لـ FlashMLA

بواسطةzddeepseeker 24 فبراير 202524 فبراير 2025

في الأسبوع الماضي، أعلنت DeepSeek أنها ستفتح خمسة مشاريع مفتوحة المصدر الأسبوع المقبل: قال مستخدمو الإنترنت، "هذه المرة، OpenAI هنا حقًا". الآن، ظهر أول مشروع مفتوح المصدر، يتعلق بتسريع الاستدلال، FlashMLA: عنوان المشروع مفتوح المصدر: DeepSeek FlashMLA لقد كان مفتوح المصدر لمدة ساعتين، وحصل موقع Github بالفعل على أكثر من 2.7 ألف نجمة:...

غير مصنف

Qwen2.5-max مقابل DeepSeek R1: مقارنة عميقة بين النماذج: تحليل كامل لسيناريوهات التطبيق

بواسطةzddeepseeker 14 فبراير 202514 فبراير 2025

مقدمة تلعب نماذج اللغة الكبيرة (LLMs) اليوم دورًا حاسمًا. في أوائل عام 2025، مع اشتداد المنافسة على الذكاء الاصطناعي، أطلقت علي بابا نموذج الذكاء الاصطناعي الجديد Qwen2.5-max، وأطلقت شركة DeepSeek، وهي شركة من هانغتشو، الصين، نموذج R1، الذي يمثل قمة تكنولوجيا LLM. Deepseek R1 هو نموذج ذكاء اصطناعي مفتوح المصدر جذب...

غير مصنف

أخبار عاجلة! أصدر OpenAI نموذجين استدلاليين جديدين اليوم: o3-mini و o3-mini-high.

بواسطةzddeepseeker 1 فبراير 20251 فبراير 2025

سيتم إصدار o3-mini و o3-mini (عالي) اليوم. سيحصل المستخدمون العاديون أيضًا على o3-mini، وسيتمكن المستخدمون الإضافيون من استخدام o3-mini (عالي). o3-mini (عالي) أعلى بحوالي 200 نقطة من o1 على Codeforce، وأسرع من o1 وأداءه أفضل في الترميز والرياضيات، لكن التكلفة لا تزال في مستوى o1-mini....

غير مصنف

الإطلاق الأول! SiliconFlow X Huawei Cloud تطلقان معًا خدمات الاستدلال DeepSeek R1 و V3 القائمة على سحابة Ascend Cloud!

بواسطةzddeepseeker 1 فبراير 20251 فبراير 2025

لقد أحدثت DeepSeek-R1 وDeepSeek-V3 ضجة عالمية منذ إطلاقهما المفتوح المصدر. إنهما هدية من فريق DeepSeek للبشرية جمعاء، ونحن سعداء بصدق لنجاحهما. بعد أيام من العمل الشاق الذي قام به فريق سيليكون موبيليتي وفريق هواوي كلاود، نقدم اليوم أيضًا للمستخدمين الصينيين...

غير مصنف

OpenAI o3-mini مقابل DeepSeek-R1: من هو ملك الجيل الجديد من نماذج الذكاء الاصطناعي؟

بواسطةzddeepseeker 1 فبراير 20251 فبراير 2025

o3-mini هنا بزخم منافس في 31 يناير، أصدرت OpenAI نموذج o3-mini الكبير الجديد تمامًا ووفرت بعض وظائفه مجانًا لجميع مستخدمي ChatGPT. على الرغم من وجود حد لعدد الاستعلامات، إلا أنه يسمح للمستخدمين بتجربة أحدث نموذج تجاري من OpenAI في أقرب وقت ممكن....

غير مصنف

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

إن التكلفة العالية لاستخدام نماذج الذكاء الاصطناعي الكبيرة هي السبب الرئيسي وراء عدم تنفيذ العديد من تطبيقات الذكاء الاصطناعي والترويج لها حتى الآن. إن اختيار الأداء المتطرف يعني تكاليف ضخمة لقوة الحوسبة، مما يؤدي إلى تكاليف استخدام عالية لا يمكن للمستخدمين العاديين قبولها. إن المنافسة على نماذج الذكاء الاصطناعي الكبيرة تشبه الحرب بلا دخان. بعد…

مقارنة شاملة بين الإصدار الجديد من OpenAI o3-mini وDeepSeek R1 من OpenAI

الملامح الأساسية

قارن

السعر

الملخص

أصدر DeepSeek الكود المصدري الخاص به، وشرحًا تفصيليًا لـ FlashMLA

Qwen2.5-max مقابل DeepSeek R1: مقارنة عميقة بين النماذج: تحليل كامل لسيناريوهات التطبيق

أخبار عاجلة! أصدر OpenAI نموذجين استدلاليين جديدين اليوم: o3-mini و o3-mini-high.

الإطلاق الأول! SiliconFlow X Huawei Cloud تطلقان معًا خدمات الاستدلال DeepSeek R1 و V3 القائمة على سحابة Ascend Cloud!

OpenAI o3-mini مقابل DeepSeek-R1: من هو ملك الجيل الجديد من نماذج الذكاء الاصطناعي؟

نموذج جوجل منخفض التكلفة، سلسلة Gemini 2.0، يهاجم: المعركة من أجل فعالية التكلفة في النماذج الكبيرة تشتد

اترك تعليقاً إلغاء الرد

الملامح الأساسية

قارن

السعر

الملخص

منشورات مشابهة

اترك تعليقاً إلغاء الرد