
o3-מיני הגיע בשעת לילה מאוחרת, ו-OpenAI סוף סוף חשפה את כרטיס הניצחון האחרון שלה. במהלך שאלה ותשובה של Reddit AMA, אלטמן התוודה עמוקות שהוא עמד בצד הלא נכון של ה-AI בקוד פתוח.
לדבריו, האסטרטגיה הפנימית של הקוד הפתוח נשקלת, והמודל ימשיך להתפתח, אך ההובלה של OpenAI לא תהיה גדולה כבעבר.
בזמן שכולם עדיין התפעלו מהעוצמה המדהימה של DeepSeek, OpenAI סוף סוף לא יכול היה לשבת בשקט יותר.
בשעות הבוקר המוקדמות של אתמול, o3-mini הושקה בדחיפות, וקבעה SOTA חדש במבחני אמת מידה כמו קוד מתמטי וחזרה לכס המלכות.
הדבר החשוב ביותר הוא שגם משתמשים בחינם יוכלו לחוות את זה! o3-mini זה לא בדיחה. ב"בחינה האחרונה לבני אדם", o3-mini (גבוה) השיג ישירות את הדיוק וטעות הכיול הטובים ביותר.

כמה שעות אחרי o3-mini עלה לאינטרנט, OpenAI פתחה רשמית Reddit AMA למשך כשעה.
גם אלטמן עצמו נכנס לאינטרנט וענה על כל השאלות של גולשים ברשת.

הדגשים העיקריים הם:
- DeepSeek הוא אכן טוב מאוד, ונמשיך לפתח דגמים טובים יותר, אבל ההובלה לא תהיה גדולה כמו קודם
- בהשוואה לפני כמה שנים, אני נוטה יותר להאמין שבינה מלאכותית עשויה לחוות קפיצות מהירה
- אנחנו בצד הלא נכון של הנושא של דגמי AI משוקלל במקור פתוח
- בקרוב יגיע עדכון למצב הקול המתקדם, ואנו נקרא לו ישירות GPT-5, לא GPT-5o. אין עדיין לוח זמנים ספציפי.
בנוסף לאלטמן עצמו, גם קצין המחקר הראשי מארק צ'ן, קצין המוצר הראשי קווין וייל, סגן הנשיא להנדסה סריניבס נאריאנן, ראש מחקר API מישל פוקראס וראש המחקר Hongyu Ren היו מקוונים וענו בקפידה על כל השאלות של משתמשים ברשת.
לאחר מכן, בואו נסתכל על מה שכולם אמרו.
אלטמן מתחרט עמוקות, לוקח את הצד הלא נכון בקרב ה-AI בקוד פתוח
ייתכן שהקאמבק הפתאומי של DeepSeek היה בלתי צפוי עבור כולם.
במהלך השאלות והתשובות של AMA, גם אלטמן עצמו התחרט עמוקות על כך שלקח את הצד הלא נכון בקרב ה-AI בקוד פתוח ונאלץ להודות ביתרונות החזקים של DeepSeek.
מה שהדהים אנשים רבים הוא שאלטמן אפילו אמר שההובלה של OpenAI לא הייתה חזקה כמו פעם.
להלן כל התשובות הקלאסיות שליקטנו מאלטמן.
ש: בואו נדבר על הנושא הגדול של השבוע: Deepseek. ברור שזה דגם מאוד מרשים, ואני יודע שהוא כנראה הוכשר על התפוקות של LLMs אחרות. איך זה ישנה את התוכניות שלך לדגמים עתידיים?
אלטמן: זה אכן דגם מאוד מרשים! נפתח דגמים טובים יותר, אבל לא נוכל לשמור על יתרון גדול כמו בשנים קודמות.
ש: האם אתה חושב ששיפור עצמי רקורסיבי יהיה תהליך הדרגתי או המראה פתאומי?
אלטמן: באופן אישי, אני חושב שאני נוטה יותר לחשוב שבינה מלאכותית עשויה להתקדם במהירות מאשר הייתי לפני כמה שנים. אולי הגיע הזמן לכתוב משהו על הנושא הזה...
ש: האם אנחנו יכולים לראות את כל האסימונים שהדוגמנית חושבת עליהם?
אלטמן: כן, בקרוב נציג גרסה מועילה ומפורטת יותר. תודה ל-R1 על העדכון.
קווין וייל, מנהל מוצר ראשי: אנחנו עובדים על להראות יותר ממה שאנחנו עושים עכשיו - זה יקרה בקרוב. אם אנחנו מראים הכל או לא נותר להחליט. הצגת כל שרשראות המחשבה (CoT) תוביל לזיקוק דגמי מתחרים, אבל אנחנו גם יודעים שמשתמשים (לפחות משתמשים מתקדמים) רוצים לראות את זה, אז נמצא איזון טוב.
ש: מתי הגרסה המלאה של o3 תהיה זמינה?
אלטמן: הייתי מעריך שזה יהיה יותר מכמה שבועות, אבל לא יותר מכמה חודשים.
ש: האם יהיה עדכון למצב הקול? האם זה עשוי להתמקד ב-GPT-5o? מהו ציר הזמן הגס עבור GPT-5o?
אלטמן: כן, מגיע עדכון למצב הקול המתקדם! אני חושב שפשוט נקרא לזה GPT-5, לא GPT-5o. אין עדיין ציר זמן ספציפי.
ש: האם היית שוקל לשחרר כמה משקולות מודל ולפרסם קצת מחקר?
אלטמן: כן, אנחנו דנים בזה. אני אישית חושב שאנחנו בצד הלא נכון של הנושא הזה וצריכים להמציא אסטרטגיית קוד פתוח אחרת; לא כולם ב-OpenAI חולקים את הדעה הזו, וזה לא בראש סדר העדיפויות שלנו כרגע.
עוד סט שאלות אחד:
- עד כמה אנחנו קרובים להציע למפעיל בתוכנית פלוס הרגילה?
- מהם סדרי העדיפויות העיקריים של מחלקת הרובוטיקה?
- איך OpenAI מרגיש לגבי שבבים/TPUs מיוחדים יותר, כמו Trillium, Cerebras וכו'? האם OpenAI שמה לב לזה?
- אילו השקעות מתבצעות כדי להתגונן מפני סיכונים עתידיים ב-AGI וב-ASI?
- מה היה החג הבלתי נשכח שלך?
אלטמן:
- כמה חודשים
- לייצר רובוט ממש טוב בקנה מידה קטן וללמוד מהניסיון
- כרגע קשה לנצח את ה-GB200!
- בחירה טובה תהיה לשפר את המצב הפנימי שלך - חוסן, הסתגלות, רוגע, שמחה וכו'.
- קשה לבחור! אבל השניים הראשונים שעולים לראש הם: תרמילאים בדרום מזרח אסיה או ספארי באפריקה
ש: מתכננים להעלות את מחיר סדרת הפלוס?
אלטמן: בעצם, אני רוצה לצמצם את זה בהדרגה.
ש: נניח שעכשיו זו שנת 2030, וזה עתה יצרת מערכת שרוב האנשים יקראו לה AGI. הוא מצטיין בכל מבחני הבנצ'מרק ומתעלה על המהנדסים והחוקרים הטובים ביותר שלך מבחינת מהירות וביצועים. מה הלאה? מלבד "להעלות את זה לאתר ולהציע את זה כשירות", יש לך תוכניות אחרות?
אלטמן: ההשפעה החשובה ביותר, לדעתי, תהיה האצת הגילוי המדעי, שלדעתי הוא הגורם שיתרום הכי הרבה לשיפור איכות החיים.
יצירת תמונות 4o, בקרוב
לאחר מכן, נוספו תגובות מחברי OpenAI אחרים.
ש: האם אתה עדיין מתכנן להשיק את מחולל התמונות 4o?
קווין וייל, מנהל מוצר ראשי: כן! ואני חושב שההמתנה שווה את זה.
ש: מעולה! האם יש לוח זמנים גס?
קווין וייל, מנהל מוצר ראשי: אתה מבקש ממני להסתבך בצרות. אולי כמה חודשים.
ועוד שאלה דומה.
ש: מתי נוכל לצפות לראות את ChatGPT-5?
קווין וייל, מנהל מוצר ראשי: זמן קצר לאחר o-17 micro ו-GPT-(π+1).
ועוד שאלה צצה:
- לאילו סוגי סוכנים אחרים אנחנו יכולים לצפות?
- וגם לספק סוכן למשתמשים בחינם, שיכול להאיץ את האימוץ...
- יש עדכונים לגבי הגרסה החדשה של DALL·E?
- שאלה אחרונה, וזו השאלה שכולם שואלים... מתי תיושם AGI?
קווין וייל, מנהל מוצר ראשי:
- סוכנים נוספים: בקרוב מאוד. אני חושב שאתה תהיה מאושר.
- יצירת תמונה על בסיס 4o: בעוד כמה חודשים, אני לא יכול לחכות שתשתמש בו. זה נהדר.
- AGI: כן
ש: האם אתה מתכנן להוסיף פונקציונליות של קובץ מצורף למודל ההיגיון?
Srinivas Narayanan, סמנכ"ל הנדסה: זה בפיתוח. בעתיד, מודל החשיבה יוכל להשתמש בכלים שונים, כולל פונקציות חיפוש.
קווין וייל, מנהל מוצר ראשי: רק לומר, אני לא יכול לחכות לראות את מודל ההיגיון מסוגל להשתמש בכלים
ש: באמת. כאשר אתה פותר בעיה זו, ייפתחו כמה תרחישי יישום AI שימושיים מאוד. תאר לעצמך שהוא מסוגל להבין את התוכן של מסמכי העבודה שלך בנפח 500GB.
כאשר אתה עומד להשיב לדוא"ל, ייפתח פאנל ליד אפליקציית הדוא"ל שלך שמנתח באופן רציף את כל המידע הקשור לאדם זה, כולל מערכת היחסים שלך, הנושאים שנדונו, עבודה קודמת וכו'. אולי משהו ממסמך שאתה שכחתי מזמן יסומן כי זה מאוד רלוונטי לדיון הנוכחי. אני כל כך רוצה את התכונה הזו.
Srinivas Narayanan, סמנכ"ל הנדסה: אנחנו עובדים על הגדלת אורך ההקשר. אין עדיין תאריך/הודעה מוצקים.
ש: עד כמה פרויקט Stargate חשוב לעתיד של OpenAI? קווין וייל, מנהל מוצר ראשי: חשוב מאוד. כל מה שראינו מצביע על כך שככל שיש לנו יותר כוח מחשוב, כך נוכל לבנות מודלים טובים יותר וכך נוכל ליצור מוצרים בעלי ערך רב יותר.
אנחנו מרחיבים מודלים בשני מימדים עכשיו - אימון מקדים גדול יותר ויותר למידה של חיזוק (RL)/"תות" - שניהם דורשים משאבי מחשוב.
שירות של מאות מיליוני משתמשים דורש גם משאבי מחשוב! וככל שאנו מתקדמים לכיוון מוצרי סוכנים חכמים יותר שיכולים לעבוד עבורך ברציפות, הדבר דורש גם משאבי מחשוב. אז אתה יכול לחשוב על Stargate כמפעל שלנו, שבו חשמל/GPUs מומרים למוצרים מדהימים.
ש: פנימית, באיזה דגם אתה משתמש כעת? o4, o5 או o6? כמה חכמים יותר המודלים הפנימיים האלה בהשוואה ל-o3?
מישל פוקראס, ראש מחקר API: איבדנו את הספירה.
ש: אנא הרשו לנו ליצור אינטראקציה עם טקסט/קנבס תוך שימוש בתכונות קוליות מתקדמות. אני רוצה להיות מסוגל לדבר איתו ולגרום לו לשנות מסמכים באופן איטרטיבי.
קווין וייל, מנהל מוצר ראשי: כן! יש לנו הרבה כלים מעולים שפותחו באופן עצמאי יחסית - המטרה היא להעביר את הכלים האלה לידיים שלך כמה שיותר מהר.
השלב הבא הוא לשלב את כל הפיצ'רים הללו כך שתוכלו לדבר עם מודל, שמחפש ומסיבות בו זמנית, וליצור קנבס שיכול להריץ את Python. כל הכלים צריכים לעבוד טוב יותר ביחד. ודרך אגב, כל הדגמים זקוקים לגישה מלאה לכלי (הדגמים מסדרת o לא יכולים כרגע להשתמש בכל הכלים), שגם היא תיושם.
ש: מתי יתמכו הדגמים מסדרת o בפונקציית הזיכרון ב-ChatGPT?
מישל פוקראס, ראש מחקר API: זה בפיתוח! איחוד כל התכונות שלנו עם הדגמים מסדרת o הוא בראש סדר העדיפויות שלנו.
ש: האם יהיו שיפורים משמעותיים ל-4o? אני מאוד אוהב את ה-GPT המותאם, וזה יהיה נהדר אם ניתן יהיה לשדרג אותו, או אם נוכל לבחור באיזה דגם להשתמש ב-Custom GPT (כגון ה-o3 mini).
מישל פוקראס, ראש מחקר API: כן, עדיין לא סיימנו עם סדרת 4o!