أطلقت جوجل ثلاثة نماذج جديدة دفعة واحدة: Gemini-2.0-Pro مجاني، ويحظى بتقييم ممتاز ويحتل المرتبة الأولى، وهو مناسب للترميز ومعالجة المطالبات المعقدة!

قصة جيمي n 1 2.0 يتسارع.

قدمت النسخة التجريبية من Flash Thinking في شهر ديسمبر للمطورين نموذج عمل يتميز بزمن انتقال منخفض وأداء عالٍ.

في وقت سابق من هذا العام، تم تحديث 2.0 Flash Thinking Experimental في Google AI Studio لتحسين الأداء بشكل أكبر من خلال الجمع بين سرعة Flash وقدرات الاستدلال المحسّنة.

في الأسبوع الماضي، تم إطلاق الإصدار المحدث 2.0 Flash بالكامل على تطبيقات سطح المكتب والجوال في جهاز Gemini.

اليوم، تم الكشف عن ثلاثة أعضاء جدد في نفس الوقت: النسخة التجريبية من Gemini 2.0 Pro، والتي حققت حتى الآن أفضل أداء في الترميز والمطالبات المعقدة، و2.0 Flash-Lite الفعال من حيث التكلفة، ونسخة 2.0 Flash Thinking المعززة بالتفكير.

يحتل برنامج Gemini 2.0 Pro المرتبة الأولى في جميع الفئات. ويحتل برنامج Gemini-2.0-Flash المرتبة الثالثة في مجال البرمجة والرياضيات والألغاز. ويحتل برنامج Flash-lite المرتبة العاشرة في جميع الفئات.

مخطط مقارنة لقدرات النماذج الثلاثة:

تدعم كافة الموديلات إدخال وإخراج النص متعدد الوسائط.

هناك المزيد من القدرات النموذجية في الطريق. مخطط قوة النموذج في ساحة الترميز

خريطة حرارية لمعدلات الفوز

تعامل Google المستخدمين المجانيين بشكل أفضل من تعامل OpenAI مع مستخدمي Plus. الوصول المجاني إلى Gemini 2.0 Pro Experimental في AI Studio:

انقر للعب

تعرض خدمة Deepseek دائمًا خطأ انتظارًا... تذكر أن أول نموذج خالٍ من الاستدلال كان أيضًا 2.0 Flash Thinking، والذي تم استخدامه في Google aistudio.

بالإضافة إلى ذلك، هناك نسخة الويب من Gemini:

هناك أيضًا نموذج استدلال متصل (فلماذا نفصله إذن...)

أطلقت شركة جوجل النسخة التجريبية من برنامج Gemini 2.0 Pro، وكان التحسن في اختبارات المعايير الرسمية مثيرًا للاهتمام للغاية.

إنها تتمتع بأقوى قدرات الترميز والقدرة على معالجة المطالبات المعقدة، ولديها قدرة أفضل على فهم والتفكير في المعرفة العالمية من أي نموذج أصدرته جوجل حتى الآن.

يحتوي على أكبر نافذة سياق (200 كيلو بايت، وسياقي الطويل هو ميزة كبيرة نسبيًا لنموذج Gemini)، مما يمكنه من تحليل وفهم كمية كبيرة من المعلومات بشكل شامل، واستدعاء أدوات مثل البحث في Google وتنفيذ التعليمات البرمجية.

في اختبار الرياضيات، حصل على 91.8%، بزيادة حوالي 5 نقاط مئوية عن الإصدار 1.5. وصلت قدرة الاستدلال GPQA إلى 64.7%، ووصل اختبار المعرفة العالمية SimpleQA إلى 44.3%.

أبرز ما يميزه هو قدرته على البرمجة. فقد حقق 36.0% في اختبار LiveCodeBench، وتجاوزت دقة تحويل Bird-SQL 59.3%. ومع اقترانه بنافذة السياق الضخمة للغاية التي تحتوي على 2 مليون رمز مميز، فإنه يكفي للتعامل مع مهام تحليل التعليمات البرمجية الأكثر تعقيدًا.

يمكنك تجربته في المؤشر.

كما أن القدرة على فهم اللغات المتعددة مثيرة للإعجاب أيضًا، حيث بلغت درجة اختبار MMLU العالمي 86.5%. ودرجة فهم الصور MMMU هي 72.7%، وقدرة تحليل الفيديو هي 71.9%.

يعد Gemini 2.0 Flash-Lite توازنًا مثيرًا للاهتمام.

إنه يحافظ على سرعة وتكلفة 1.5 Flash، لكنه يوفر أداءً أفضل. تتيح له نافذة السياق التي تحتوي على مليون رمز معالجة المزيد من المعلومات.

الأمر الأكثر عملية هو نسبة السعر إلى الأداء: تكلفة إنشاء التعليقات التوضيحية لـ 40000 صورة أقل من $1. وهذا يجعل الذكاء الاصطناعي أكثر واقعية.

ذكر المدون Shrivastava: ترميز Gemini 2.0 Pro مجنون!

نصيحة: استخدم Three.js لإنشاء محاكاة للنظام الشمسي. أضف مقياسًا زمنيًا وقائمة منسدلة للتركيز وإظهار المدارات وإظهار العلامات. أنشئ كل شيء في ملف واحد حتى أتمكن من لصقه في محرر عبر الإنترنت وعرض الناتج.

بالإضافة إلى ذلك، ذكر بعض المستخدمين أن برنامج Gemini 2.0 Flash أنتج نتائج أفضل في أحد اختبارات المفارقة الخاصة به:

وأخيرًا، ذكرت جوجل أن أمان Gemini 2.0، وليس التصحيح فقط، هو جوهر التصميم منذ البداية.

دع النموذج يتعلم كيفية انتقاد نفسه. استخدم التعلم التعزيزي للسماح لـ Gemini بتقييم إجاباته الخاصة وتقديم ملاحظات أكثر دقة. هذا يجعله أكثر قوة عند التعامل مع الموضوعات الحساسة.

إن اختبار الفريق الأحمر الآلي مثير للاهتمام. فهو مصمم خصيصًا لمنع حقن الكلمات غير المباشرة، وهو ما يشبه تزويد الذكاء الاصطناعي بنظام مناعي لمنع شخص ما من إخفاء الأوامر الضارة في البيانات.

منشورات مشابهة

غير مصنف

كاتي وود: إن DeepSeek يعمل فقط على تسريع عملية خفض التكاليف؛ وسوف يتغير هيكل السوق المركّز للغاية الذي يمكن مقارنته بالكساد الأعظم

بواسطةzddeepseeker 8 فبراير 20258 فبراير 2025

أبرز النقاط المنافسة مع DeepSeek مفيدة للولايات المتحدة كاثي وود: أعتقد أن هذا يُظهِر أن تكلفة الابتكار تتراجع بشكل كبير، وأن هذا الاتجاه بدأ بالفعل. على سبيل المثال، قبل DeepSeek، انخفضت تكلفة تدريب الذكاء الاصطناعي بمقدار 75% سنويًا، وانخفضت تكلفة الاستدلال بمقدار 85% إلى 1.5 تريليون دولار.

غير مصنف

كيف تم إنشاء DeepSeek؟ تحليل لتاريخ نمو DeepSeek

بواسطةzddeepseeker فبراير 3، 2025فبراير 3، 2025

في المستقبل، سيكون هناك المزيد والمزيد من الابتكارات المتشددة. قد لا يكون من السهل فهم ذلك الآن، لأن المجموعة الاجتماعية بأكملها تحتاج إلى التثقيف بالحقائق. عندما يسمح هذا المجتمع للأشخاص الذين يبتكرون بشكل متشدد بالنجاح، ستتغير العقلية الجماعية. نحتاج فقط إلى مجموعة من الحقائق وعملية....

غير مصنف

السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

بواسطةzddeepseeker 9 فبراير 20259 فبراير 2025

أود اليوم أن أشارككم مقالاً من DeepSeek بعنوان DeepSeekMath: دفع حدود التفكير الرياضي في نماذج اللغة المفتوحة. يقدم هذا المقال DeepSeekMath 7B، والذي تم تدريبه مسبقًا على DeepSeek-Coder-Base-v1.5 7B استنادًا إلى مجموعة من 120B من الرموز المرتبطة بالرياضيات واللغة الطبيعية وبيانات الكود. حقق النموذج درجة مذهلة بلغت 51.7% في المستوى التنافسي...

غير مصنف

The Showdown of the Top Four Models! A Review Showcases How Powerful Deepseek R1 Is

بواسطةzddeepseeker يونيو 1, 2025يونيو 1, 2025

Over the past few days, Deepseek-R1 0528 has been officially open-sourced. On LiveCodeBench, its performance is nearly on par with OpenAI’s o3 (high); in Aider’s multi-language benchmark test, it holds its own against Claude Opus. When it was launched on the official website, we quickly tested its front-end capabilities and found them to be exceptionally…

غير مصنف

ما هو FlashMLA؟ دليل شامل لتأثيره على نوى فك تشفير الذكاء الاصطناعي

بواسطةdeepseeker 24 فبراير 202524 فبراير 2025

اكتسبت FlashMLA اهتمامًا سريعًا في عالم الذكاء الاصطناعي، وخاصة في مجال نماذج اللغة الكبيرة (LLMs). تعمل هذه الأداة المبتكرة، التي طورها DeepSeek، كنواة فك تشفير مُحسَّنة مصممة لوحدات معالجة الرسوميات Hopper - وهي شرائح عالية الأداء تُستخدم عادةً في حسابات الذكاء الاصطناعي. تركز FlashMLA على المعالجة الفعّالة للتسلسلات ذات الطول المتغير، مما يجعلها مناسبة بشكل خاص...

غير مصنف

أدوات إدارة نماذج اللغة الكبيرة مثل DeepSeek: Cherry Studio، Chatbox، AnythingLLM، من هو مسرع الكفاءة الخاص بك؟

بواسطةzddeepseeker 11 فبراير 202511 فبراير 2025

لقد بدأ العديد من الأشخاص بالفعل في نشر واستخدام نماذج اللغة الكبيرة Deepseek محليًا، باستخدام Chatbox كأداة تصور. ستستمر هذه المقالة في تقديم اثنين من أدوات إدارة وتصور نماذج اللغة الكبيرة AI، وستقارن الثلاثة بالتفصيل لمساعدتك على استخدام نماذج اللغة الكبيرة AI بكفاءة أكبر. في عام 2025،...

أطلقت جوجل ثلاثة نماذج جديدة دفعة واحدة: Gemini-2.0-Pro هو نموذج مجاني، ويتمتع بتقييم ممتاز ويحتل المرتبة الأولى، وهو مناسب للترميز ومعالجة المطالبات المعقدة!

كاتي وود: إن DeepSeek يعمل فقط على تسريع عملية خفض التكاليف؛ وسوف يتغير هيكل السوق المركّز للغاية الذي يمكن مقارنته بالكساد الأعظم

كيف تم إنشاء DeepSeek؟ تحليل لتاريخ نمو DeepSeek

السر وراء DeepSeek 1 | تفاصيل DeepSeekMath وGRPO

The Showdown of the Top Four Models! A Review Showcases How Powerful Deepseek R1 Is

ما هو FlashMLA؟ دليل شامل لتأثيره على نوى فك تشفير الذكاء الاصطناعي

أدوات إدارة نماذج اللغة الكبيرة مثل DeepSeek: Cherry Studio، Chatbox، AnythingLLM، من هو مسرع الكفاءة الخاص بك؟

اترك تعليقاً إلغاء الرد