o3-mini Наступила глубокая ночь, и OpenAI наконец-то раскрыл свой последний козырь. В ходе Reddit AMA Q&A Альтман глубокомысленно признался, что стоял не на той стороне открытого ИИ.

Он сказал, что внутренняя стратегия открытого исходного кода рассматривается, и модель будет продолжать развиваться, но лидерство OpenAI не будет таким большим, как раньше.

Пока все восхищались удивительной мощью DeepSeek, OpenAI, наконец, не могла больше сидеть на месте.

Ранним утром вчерашнего дня был срочно запущен o3-mini, установивший новые SOTA в эталонных тестах, таких как математический код и возвращение на трон.

Самое главное, что бесплатные пользователи тоже могут испытать это! o3-mini - это не шутка. На "последнем экзамене для людей" o3-mini (высокий) показал лучшие результаты по точности и погрешности калибровки.

Через несколько часов после o3-mini вышел в сетьВ течение часа OpenAI официально открыла AMA на Reddit.

Сам Альтман также вышел в сеть и ответил на все вопросы пользователей.

Основные моменты:

  • DeepSeek действительно очень хорошМы будем продолжать разрабатывать более совершенные модели, но преимущество будет не таким большим, как раньше.
  • По сравнению с тем, что было несколько лет назад, сейчас я больше склоняюсь к тому, что ИИ может совершить стремительный скачок.
  • Мы находимся на неправильной стороне вопроса об открытом доступе к взвешенным моделям ИИ
  • Скоро выйдет обновление расширенного голосового режима, и мы будем называть его GPT-5, а не GPT-5o. Конкретного расписания пока нет.

Помимо самого Альтмана, главный директор по исследованиям Марк Чен, главный директор по продуктам Кевин Вайл, вице-президент по инженерным вопросам Сринивас Нараянан, руководитель отдела исследований API Мишель Покрасс и руководитель отдела исследований Хонгю Рен также были онлайн и внимательно отвечали на все вопросы нетизенов.

Далее давайте посмотрим, что они все сказали.

Альтман глубоко раскаивается в том, что занял не ту сторону в битве за ИИ с открытым исходным кодом

Внезапное возвращение DeepSeek, возможно, стало неожиданностью для всех.

В ходе AMA Q&A сам Альтман также глубоко раскаялся в том, что занял не ту сторону в борьбе за ИИ с открытым исходным кодом, и был вынужден признать сильные преимущества DeepSeek.

Многих поразило то, что Альтман даже сказал, что лидерство OpenAI уже не такое сильное, как раньше.

Ниже приведены все классические ответы, которые мы собрали у Альтмана.

В: Давайте поговорим о главной теме недели: Deepseek. Это, безусловно, очень впечатляющая модель, и я знаю, что она, вероятно, была обучена на основе результатов других LLM. Как это изменит ваши планы на будущие модели?

Альтман: Это действительно очень впечатляющая модель! Мы будем разрабатывать более совершенные модели, но нам не удастся сохранить такой большой отрыв, как в предыдущие годы.

В: Как вы думаете, рекурсивное самосовершенствование будет постепенным процессом или внезапным взлетом?

Альтман: Лично я думаю, что я более склонен считать, что ИИ может быстро прогрессировать, чем несколько лет назад. Может быть, пришло время написать что-нибудь на эту тему...

Вопрос: Можем ли мы увидеть все жетоны, о которых думает модель?

Альтман: Да, скоро мы покажем более полезную и подробную версию. Спасибо R1 за обновление.

Кевин Вейл, директор по продуктам: Мы работаем над тем, чтобы показывать больше, чем сейчас - это произойдет в ближайшее время. Будем ли мы показывать все или нет, еще предстоит определить. Показ всех цепочек мышления (CoT) приведет к дистилляции моделей конкурентов, но мы также знаем, что пользователи (по крайней мере, продвинутые) хотят видеть это, поэтому мы найдем хороший баланс.

В: Когда будет доступна полная версия o3?

Альтман: Я бы предположил, что это займет больше нескольких недель, но не больше нескольких месяцев.

В: Будет ли обновление голосового режима? Является ли это потенциальным фокусом для GPT-5o? Каковы примерные сроки выхода GPT-5o?

Альтман: Да, обновление расширенного голосового режима уже на подходе! Думаю, мы назовем его GPT-5, а не GPT-5o. Конкретных сроков пока нет.

В: Не могли бы вы выпустить несколько моделей весов и опубликовать некоторые исследования?

Альтман: Да, мы обсуждаем этот вопрос. Лично я считаю, что мы находимся на неправильной стороне этого вопроса и должны выработать другую стратегию открытого кода; не все в OpenAI разделяют эту точку зрения, и в данный момент это не является нашим главным приоритетом.

Еще один набор вопросов:

  • Насколько мы близки к тому, чтобы предложить Operator в обычной программе Plus?
  • Каковы основные приоритеты отдела робототехники?
  • Как OpenAI относится к более специализированным чипам/TPU, таким как Trillium, Cerebras и т.д.? Обращает ли OpenAI на это внимание?
  • Какие инвестиции осуществляются для хеджирования будущих рисков в AGI и ASI?
  • Какой отпуск запомнился вам больше всего?

Альтман:

  • Несколько месяцев
  • создать действительно хорошего робота в небольших масштабах и извлечь уроки из полученного опыта
  • В настоящее время GB200 трудно превзойти!
  • Хорошим выбором будет улучшение внутреннего состояния - устойчивости, адаптивности, спокойствия, радости и т.д.
  • Трудно выбрать! Но первые два, которые приходят на ум: путешествие с рюкзаком по Юго-Восточной Азии или сафари в Африке.

В: Планируете ли вы поднять цену на серию Plus?

Альтман: На самом деле, я хочу постепенно сокращать его.

Вопрос: Предположим, сейчас 2030 год, и вы только что создали систему, которую большинство людей назвали бы AGI. Она превосходит все эталонные тесты и превосходит ваших лучших инженеров и исследователей по скорости и производительности. Что дальше? Кроме "выложить на сайт и предложить в качестве услуги", есть ли у вас другие планы?

Альтман: Самое важное влияние, на мой взгляд, будет заключаться в ускорении научных открытий, что, как мне кажется, в наибольшей степени будет способствовать улучшению качества жизни.

Генерация изображений 4o, скоро будет

Затем были добавлены ответы от других членов OpenAI.

В: Вы все еще планируете запустить генератор изображений 4o?

Кевин Вейл, директор по продуктам: Да! И я думаю, что ожидание того стоит.

В: Отлично! Есть ли примерное расписание?

Кевин Вейл, директор по продуктам: Вы просите меня ввязаться в неприятности. Может быть, на несколько месяцев.

И еще один похожий вопрос.

В: Когда мы можем ожидать появления ChatGPT-5?

Кевин Вейл, директор по продуктам: Вскоре после o-17 micro и GPT-(π+1).

И тут возникает другой вопрос:

  • Какие еще типы агентов можно ожидать?
  • А также предоставить агент для бесплатных пользователей, что может ускорить внедрение...
  • Есть ли какие-нибудь новости о новой версии DALL-E?
  • И последний вопрос, который задают все... Когда будет реализован AGI?

Кевин Вейл, директор по продукции:

  • Другие агенты: очень, очень скоро. Думаю, вы будете счастливы.
  • Генерация изображений на основе 4o: через несколько месяцев, я не могу дождаться, когда вы начнете его использовать. Это великолепно.
  • AGI: Да

Вопрос: Планируете ли вы добавить в модель рассуждений функцию вложения файлов?

Шринивас Нараянан, вице-президент по проектированию: Она находится в разработке. В будущем модель рассуждений сможет использовать различные инструменты, включая функции поиска.

Кевин Вейл, директор по продуктам: Я просто хочу сказать, что мне не терпится увидеть модель обоснования возможности использования инструментов.

В: Действительно. Когда вы решите эту проблему, откроется несколько очень полезных сценариев применения ИИ. Представьте, что он сможет понять содержание ваших рабочих документов объемом 500 ГБ.

Когда вы собираетесь ответить на письмо, рядом с вашим почтовым приложением открывается панель, которая непрерывно анализирует всю информацию, связанную с этим человеком, включая ваши отношения, обсуждаемые темы, прошлые работы и т. д. Возможно, что-то из давно забытого вами документа будет отмечено, потому что это очень важно для текущего обсуждения. Я так хочу эту функцию.

Шринивас Нараянан, вице-президент по инженерным вопросам: Мы работаем над увеличением продолжительности контекста. Пока нет твердой даты/анонса.

В: Насколько важен проект Stargate для будущего OpenAI? Кевин Вейл, директор по продуктам: Очень важно. Все, что мы видели, говорит о том, что чем больше у нас вычислительных мощностей, тем лучшие модели мы можем строить и тем более ценные продукты мы можем создавать.

Сейчас мы масштабируем модели в двух направлениях - увеличиваем объем предварительной подготовки и увеличиваем объем обучения с подкреплением (RL)/"клубничного" обучения - оба эти направления требуют вычислительных ресурсов.

Обслуживание сотен миллионов пользователей также требует вычислительных ресурсов! И поскольку мы движемся в сторону более интеллектуальных агентских продуктов, которые могут работать на вас непрерывно, это также требует вычислительных ресурсов. Так что вы можете считать Stargate нашей фабрикой, где электричество/ГПУ превращается в удивительные продукты.

Вопрос: Какую внутреннюю модель вы используете сейчас? o4, o5 или o6? Насколько эти внутренние модели умнее, чем o3?

Мишель Покрасс, руководитель отдела исследований API: Мы сбились со счета.

Вопрос: Пожалуйста, позвольте нам взаимодействовать с текстом/канвой, используя расширенные голосовые функции. Я хочу иметь возможность говорить с ним и итеративно изменять документы.

Кевин Вейл, директор по продуктам: Да! У нас есть множество отличных инструментов, которые были разработаны относительно независимо друг от друга - наша цель состоит в том, чтобы как можно быстрее передать их в ваши руки.

Следующий шаг - интеграция всех этих функций, чтобы вы могли общаться с моделью, которая одновременно ищет и рассуждает, и генерировать канву, на которой можно работать с Python. Все инструменты должны лучше работать вместе. И, кстати, всем моделям нужен полный доступ к инструментам (модели o-серии сейчас не могут использовать все инструменты), что также будет реализовано.

Вопрос: Когда модели серии o будут поддерживать функцию памяти в ChatGPT?

Мишель Покрасс, руководитель отдела исследований API: Это в разработке! Унификация всех наших функций с моделями серии o - наш главный приоритет.

Вопрос: Будут ли какие-нибудь серьезные улучшения в 4o? Мне очень нравится пользовательский GPT, и было бы здорово, если бы его можно было обновить, или если бы мы могли выбирать, какую модель использовать в пользовательском GPT (например, o3 mini).

Мишель Покрасс, руководитель отдела исследований API: Да, мы еще не закончили работу над серией 4o!

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *