חדשות מרעננות! OpenAI הוציאה היום 2 דגמי מסקנות חדשים: o3-mini ו-o3-mini-high.

o3-מיני ו-o3-mini (גבוה) ישוחרר היום.

משתמשים רגילים יקבלו גם o3-מיני, ומשתמשים פלוס יוכלו להשתמש ב-o3-mini (גבוה).

o3-mini (גבוה) גבוה בכ-200 נקודות מ-o1 ב-Codeforce, מהיר יותר מ-o1, ומתפקד טוב יותר בקידוד ובמתמטיקה, אך העלות עדיין ברמה של o1-mini.

בנוסף, משתמשים יכולים להשתמש ב-o3-mini 100 פעמים ביום. עם זאת, יש לאשר עוד יותר את מגבלת השימוש של o3-mini (גבוהה).

כמה גולשים ברשת אמרו, כן, R1 כל כך פופולרי שאופנאי לא יכול להתאפק:

ומקודם, צוות Alibaba Qwen שחרר את qwen2.5-max בערב השנה החדשה. במהלך פסטיבל האביב, כולם עדיין צריכים להתגלגל, חחחח...

למעשה, כבר בשידור החי של חג המולד, Openai הודיעה כי o3 mini יהיה זמין בתחילת 2025:

תוֹכֶן הָעִניָנִים

אנחנו עדיין צריכים לדבר על מה זה o3 ו-o3-mini?

o3: מודל מסקנות חדשני המצטיין בקידוד, מתמטיקה ואפילו מבחני אמת מידה מוכווני AGI. הוא מציב רף חדש לאינטליגנציה ופתרון בעיות.

o3-מיני: גרסה חסכונית של o3 המספקת ביצועים מעולים בעלות ובמהירות נמוכים מאוד.

מודלים אלה לקחו מסקנות לרמה חדשה לגמרי, והפכו פריצות דרך במשימות מורכבות לאפשריות הדורשות הבנה והיגיון מעמיקים.

o3 מביאה שלוש פריצות דרך עיקריות.

יכולת תכנות: 71.7% דיוק בתכנות מעשי, 20% גבוה מ-o1. 2727 נקודות ב-Codeforces, כבר עולים על הרמה האנושית.

רמת מתמטיקה: דיוק של כמעט 97% בסבב המוקדמות של אולימפיאדת המתמטיקה בארה"ב. אפילו הבעיות הקשות ביותר במתמטיקה Epic AI Frontier מתמטיקה יכולות להשיג תוצאות של 25%.

הדבר המדהים ביותר הוא מבחן Arc AGI: 87.5%, העולה על בני אדם בפעם הראשונה במבחן הבנצ'מרק הקשה ביותר הזה.

מדוע ה-o3-mini הוא חידוש משבש? ה-o3-mini מביא שני שינויים.

חשיבה מסתגלת: ניתן להתאים את עומק החשיבה לפי קושי המשימה, עם שלושה מצבים לבחירה: נמוך, בינוני וגבוה.

זה הופך את ה-AI למתאים יותר לתרחישי שימוש בעולם האמיתי.

פריצת דרך של עלות-תועלת: עלות נמוכה יותר מה-o1-mini, תגובה מהירה יותר ותוצאות טובות יותר.

עם זאת, משתמשים ברשת מבינים ש-o3 high צורך $1,000 למשימה:

בנוסף, אכן יש יותר מדי דגמים זמינים, ועדיין לא אישרנו כיצד לעבור ביניהם.

לא מסווג

מה זה FlashMLA? מדריך מקיף להשפעתו על ליבות פענוח בינה מלאכותית

עַל יְדֵיdeepseeker 24 בפברואר 202524 בפברואר 2025

FlashMLA זכה במהירות לתשומת לב בעולם הבינה המלאכותית, במיוחד בתחום מודלים של שפה גדולה (LLMs). הכלי החדשני הזה, שפותח על ידי DeepSeek, משמש כגרעין פענוח אופטימלי המיועד ל-Hopper GPUs - שבבים בעלי ביצועים גבוהים הנפוצים בחישובי AI. FlashMLA מתמקדת בעיבוד יעיל של רצפים באורך משתנה, מה שהופך אותו למתאים במיוחד...

לא מסווג

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני

עַל יְדֵיzddeepseeker 4 בפברואר 20254 בפברואר 2025

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני רק עכשיו, שמנו לב שחוקר DeepSeek Daya Guo הגיב לשאלות של גולשים ברשת לגבי DeepSeek R1 ותוכניות החברה קדימה. אנחנו יכולים רק לומר…

לא מסווג

במעגל AI, DeepSeek R1 עבר בהתמדה את o1 וקלוד במבחנים פיזיים, ונכנסנו לתור הזהב של RL.

עַל יְדֵיzddeepseeker 1 בפברואר 20251 בפברואר 2025

אף אחד מאיתנו לא ציפה שכך תתחיל 2025 בתחום הבינה המלאכותית. DeepSeek R1 הוא באמת מדהים! לאחרונה, "הכוח המזרחי המסתורי" DeepSeek "שלט קשה" בעמק הסיליקון. ביקשתי מ-R1 להסביר את משפט פיתגורס בפירוט. כל זה נעשה על ידי AI תוך פחות מ-30 שניות ללא כל...

לא מסווג

עדכון DeepSeek-R1-0528: חשיבה עמוקה יותר, הנמקה חזקה יותר

עַל יְדֵיzddeepseeker 29 במאי, 202529 במאי, 2025

דגם ה-DeepSeek R1 עבר שדרוג גרסה קל, כאשר הגרסה הנוכחית היא DeepSeek-R1-0528. כשאתם נכנסים לדף האינטרנט או לאפליקציה של DeepSeek, הפעילו את התכונה "חשיבה עמוקה" בממשק הדיאלוג כדי לחוות את הגרסה העדכנית ביותר. משקלי דגם ה-DeepSeek-R1-0528 הועלו ל-HuggingFace. במהלך ארבעת החודשים האחרונים, DeepSeek-R1 עבר...

לא מסווג

השקה ראשונה! SiliconFlow X Huawei Cloud משיק במשותף שירותי הסקת DeepSeek R1 ו-V3 המבוססים על Ascend Cloud!

עַל יְדֵיzddeepseeker 1 בפברואר 20251 בפברואר 2025

DeepSeek-R1 ו-DeepSeek-V3 עוררו סנסציה עולמית מאז השקת הקוד הפתוח שלהם. הם מתנה מצוות DeepSeek לכל האנושות, ואנו שמחים באמת ובתמים על הצלחתם. לאחר ימים של עבודה מאומצת של צוותי Silicon Mobility ו-Huawei Cloud, היום אנחנו גם נותנים למשתמשים סיניים...

לא מסווג

טכנולוגיית DeepSeek-R1 נחשפה: עקרונות הליבה של הנייר מפורקים והמפתח לביצועי מודל פורצי דרך נחשף

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

היום נשתף את DeepSeek R1, כותרת: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: תמריץ את יכולת החשיבה של LLM באמצעות למידת חיזוק. מאמר זה מציג את הדור הראשון של דגמי החשיבה של DeepSeek, DeepSeek-R1-Zero ו-DeepSeek-R1. מודל DeepSeek-R1-Zero הוכשר באמצעות למידת חיזוק בקנה מידה גדול (RL) ללא כוונון עדין מפוקח (SFT) כצעד ראשוני,...

אנחנו עדיין צריכים לדבר על מה זה o3 ו-o3-mini?

o3 מביאה שלוש פריצות דרך עיקריות.

מדוע ה-o3-mini הוא חידוש משבש? ה-o3-mini מביא שני שינויים.

פוסטים דומים

כתיבת תגובה לבטל