OpenAI פרסמה את מודל ההסקה האחרון שלה, o3-מיני, אשר מותאם לתחומים כגון מדע, מתמטיקה ותכנות, ומספק תגובה מהירה יותר, דיוק גבוה יותר ועלות נמוכה יותר.

בהשוואה לקודמו o1-mini, o3-mini שיפרה משמעותית את יכולות ההסקה שלה, במיוחד בפתרון בעיות מורכבות. בודקים מעדיפים את התשובות של o3-mini לפי 56%, ושיעור השגיאות הופחת ב-39%. מהיום, ChatGPT Plus, צוות ו מִקצוֹעָן משתמשים יכולים להשתמש ב-o3-mini, ו משתמשים בחינם יכול גם לחוות חלק מהתכונות שלו.

בהשוואה למודל ההסקה DeepSeek-R1, כמה טוב יותר OpenAI o3-mini מאשר R1?

מאמר זה ייתן תחילה סקירה כללית של הדגשים של o3-mini, ולאחר מכן נחלץ את הנתונים משני הצדדים בכל מדד וניצור גרף כדי להשוות ביניהם ויזואלית. בנוסף, נשווה גם מחיר של o3-mini.

דגשים הליבה

1.אופטימיזציה של STEM: מצטיין בתחומי מתמטיקה, תכנות, מדעים וכו', במיוחד מתעלה על o1-mini במצב המאמץ הגבוה.

2.פונקציות מפתחים: תומך בפונקציות כגון קריאות לפונקציות, פלט מובנה והודעות מפתח כדי לענות על הצרכים של סביבת הייצור.

3.תגובה מהירה: 24% מהיר יותר מ-o1-mini, עם זמן תגובה של 7.7 שניות לכל בקשה.

4.שיפור אבטחה: מבטיח פלט מאובטח ואמין באמצעות טכנולוגיית יישור עמוק.

5.חסכוני: יכולות מסקנות ואופטימיזציה של עלויות הולכים יד ביד, ומקטינים מאוד את הסף לשימוש ב-AI.

לְהַשְׁווֹת

Open AI על מנת להדגיש את המחלקה שלו, שלה בלוג רשמי משווה אותו רק לדגמים משלו. לכן, מאמר זה הוא טבלה שהופקה ממאמר DeepSeek R1 והנתונים מהבלוג הרשמי של OpenAI.

OpenAI משווה באופן רשמי o3-מיני ברשימת הגרסאות, בחלוקה לשלוש גרסאות: נמוכה, בינונית וגבוהה, המעידות על חוזק מסקנות. מכיוון ש-DeepSeek משתמש ב- Math-500 ו-OpenAI משתמש במערך הנתונים של Math, השוואה זו הוסרה כאן.

תרשים אינטואיטיבי יותר, ו-Codeforces הוסר מכיוון שהערכים גדולים מכדי להציג אותם באופן אינטואיטיבי. עם זאת, ההשוואה ב-Codeforces מראה שעוצמת ההסקה הגבוהה של o3-mini אינה מובילה במיוחד.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

מהתרשים, יש בסך הכל 4 השוואות, וה-O3-mini (גבוה) בדרך כלל מוביל, אבל ההובלה קטנה מאוד.

מְחִיר

דֶגֶםמחיר קלטפגיעה במטמוןמחיר פלט
o3-מיני$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

תַקצִיר

כאשר DeepSeek R1 מפעיל את פאניקה של DeepSeek בארצות הברית, הראשון שהרגיש מאוים היה OpenAI, מה שבא לידי ביטוי במיוחד בתמחור של הדגם החדש שלה o3-mini.

כאשר Openai o1 שוחרר לראשונה, המחיר הגבוה שלה הפעיל לחץ על מפתחים ומשתמשים רבים. המראה של DeepSeek R1 נתן לכולם אפשרויות נוספות.מהפרש המחיר של פי 30 בין o1 ל-R1 ועד שהמחיר הסופי של o3-mini הוא פעמיים המחיר של DeepSeek R1,

מראה את ההשפעה של DeepSeek R1 על openai.עם זאת, משתמשי ChatGPT החינמיים יכולים לחוות את o3-mini רק בצורה מוגבלת, בעוד שהחשיבה העמוקה של DeepSeek זמינה כעת לכל המשתמשים.אני גם מצפה ל-openai להביא עוד דגמי AI מובילים תוך הפחתת עלות השימוש למשתמשים.

מנקודת המבט של הניסיון האישי של בלוגר בשימוש ב-R1, אני רוצה לומר שהחשיבה העמוקה של R1 תמיד פותחת את דעתי. אני ממליץ לכולם להשתמש בו יותר כדי לחשוב על בעיות~

פוסטים דומים

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *