
o3-מיני ו-o3-mini (גבוה) ישוחרר היום.

משתמשים רגילים יקבלו גם o3-מיני, ומשתמשים פלוס יוכלו להשתמש ב-o3-mini (גבוה).
o3-mini (גבוה) גבוה בכ-200 נקודות מ-o1 ב-Codeforce, מהיר יותר מ-o1, ומתפקד טוב יותר בקידוד ובמתמטיקה, אך העלות עדיין ברמה של o1-mini.

בנוסף, משתמשים יכולים להשתמש ב-o3-mini 100 פעמים ביום. עם זאת, יש לאשר עוד יותר את מגבלת השימוש של o3-mini (גבוהה).
כמה גולשים ברשת אמרו, כן, R1 כל כך פופולרי שאופנאי לא יכול להתאפק:


ומקודם, צוות Alibaba Qwen שחרר את qwen2.5-max בערב השנה החדשה. במהלך פסטיבל האביב, כולם עדיין צריכים להתגלגל, חחחח...
למעשה, כבר בשידור החי של חג המולד, Openai הודיעה כי o3 mini יהיה זמין בתחילת 2025:


אנחנו עדיין צריכים לדבר על מה זה o3 ו-o3-mini?
o3: מודל מסקנות חדשני המצטיין בקידוד, מתמטיקה ואפילו מבחני אמת מידה מוכווני AGI. הוא מציב רף חדש לאינטליגנציה ופתרון בעיות.
o3-מיני: גרסה חסכונית של o3 המספקת ביצועים מעולים בעלות ובמהירות נמוכים מאוד.
מודלים אלה לקחו מסקנות לרמה חדשה לגמרי, והפכו פריצות דרך במשימות מורכבות לאפשריות הדורשות הבנה והיגיון מעמיקים.
o3 מביאה שלוש פריצות דרך עיקריות.
יכולת תכנות: 71.7% דיוק בתכנות מעשי, 20% גבוה מ-o1. 2727 נקודות ב-Codeforces, כבר עולים על הרמה האנושית.
רמת מתמטיקה: דיוק של כמעט 97% בסבב המוקדמות של אולימפיאדת המתמטיקה בארה"ב. אפילו הבעיות הקשות ביותר במתמטיקה Epic AI Frontier מתמטיקה יכולות להשיג תוצאות של 25%.
הדבר המדהים ביותר הוא מבחן Arc AGI: 87.5%, העולה על בני אדם בפעם הראשונה במבחן הבנצ'מרק הקשה ביותר הזה.

מדוע ה-o3-mini הוא חידוש משבש? ה-o3-mini מביא שני שינויים.
חשיבה מסתגלת: ניתן להתאים את עומק החשיבה לפי קושי המשימה, עם שלושה מצבים לבחירה: נמוך, בינוני וגבוה.
זה הופך את ה-AI למתאים יותר לתרחישי שימוש בעולם האמיתי.
פריצת דרך של עלות-תועלת: עלות נמוכה יותר מה-o1-mini, תגובה מהירה יותר ותוצאות טובות יותר.
עם זאת, משתמשים ברשת מבינים ש-o3 high צורך $1,000 למשימה:

בנוסף, אכן יש יותר מדי דגמים זמינים, ועדיין לא אישרנו כיצד לעבור ביניהם.
