En OpenAI lanzó el modelo o3-miniEl Director General, Sam Altman, el Director de Investigación, Mark Chen, y el Director de Producto, Kevin Weil;
El Vicepresidente de Ingeniería, Srinivas Narayanan, la Directora de Investigación de API, Michelle Pokrass, y el Director de Investigación, Hongyu Ren, llevaron a cabo una sesión de preguntas y respuestas técnicas en reddit, uno de los foros más completos del mundo.
Los principales temas tratados fueron la situación actual de OpenAI, la planificación de futuros productos y el fenómeno global del gran modelo DeepSeek-R1.
Las mejores preguntas
Un usuario preguntó: "¿Podemos ver todas las fichas de pensamiento del modelo grande?".
Sam Altman: "Sí, pronto mostraremos una versión más útil y detallada. Esto es gracias a una actualización en R1.
Kevin Weil: Estamos trabajando para mostrar más de lo que mostramos hoy - esto sucederá pronto. La forma exacta de mostrar todo el contenido está aún por determinar, pero mostrar todas las cadenas de pensamiento podría conducir a un refinamiento competitivo.
Pero también sabemos que la gente (al menos los usuarios avanzados) quiere ver esto, así que encontraremos la forma adecuada de equilibrarlo.
Srinivas Narayanan: Estamos buscando maneras de mostrar más del proceso de pensamiento. Estén atentos.
¿Considerará la posibilidad de dar a conocer algunos modelos de pesos y publicar algunas investigaciones?
Sam Altman: Sí, lo estamos debatiendo. Creo que elegimos el lado históricamente equivocado del código cerrado y tenemos que idear una estrategia de código abierto diferente. No todo el mundo comparte esta opinión, y no es nuestra máxima prioridad en este momento.
Hablemos del tema candente de esta semana, Deepseek. Obviamente, se trata de un modelo impresionante, y sé que probablemente fue entrenado con los resultados de otros grandes modelos. ¿Cómo afectará esto a sus planes para futuros modelos?
Sam Altman: Es un modelo muy bueno. Desarrollaremos modelos mejores, pero nuestra ventaja será menor que en años anteriores.
Supongamos que estamos en 2030 y usted acaba de crear un sistema general de inteligencia artificial (AGI). Sobresale en todas las pruebas de referencia que usted establece, superando a sus mejores ingenieros e investigadores tanto en velocidad como en rendimiento. ¿Y ahora qué? ¿Algún plan más allá de "lanzarlo en la web"?
Sam Altman: El impacto más importante, en mi opinión, será acelerar los descubrimientos científicos, porque creo que es el factor que más contribuirá a mejorar la calidad de vida.
Srinivas Narayanan: La interfaz a través de la cual interactuamos con la IA cambiará radicalmente. La IA será más autónoma y procesará continuamente tareas y objetivos complejos por nosotros en segundo plano.
Sólo se pondrán en contacto con nosotros cuando sea necesario. La robótica también debería haber avanzado lo suficiente como para poder realizar tareas útiles para nosotros en el mundo real. (A juzgar por esta respuesta, AI Agent es, de hecho, uno de los mejores casos de uso para AGI).
Al parecer, las funciones avanzadas de diálogo de voz han disminuido desde que se lanzó la función de vídeo. Hay algún plan para arreglar o mejorar esto?
Srinivas Narayanan: Gracias por el comentario, lo estudiaremos.
¿Por qué el plazo de conocimiento de la o3 - mini ¿todavía en octubre de 2023? ¿Es también el caso del o3 o del o3 Pro? ¿Hay algún plan para actualizar el plazo de conocimiento?
Antes de pagar la suscripción Plus, la fecha límite de conocimientos para GPT - 4o era junio de 2024, pero ahora que he pagado, la fecha límite de conocimientos ha vuelto a octubre de 2023. ¿Por qué ocurre esto?
Sam Altman: Ahora que hemos activado la búsqueda, esto (la fecha de caducidad de los conocimientos) es menos importante. Personalmente, nunca volveré a pensar en la fecha de caducidad de los conocimientos.
¿Qué otros agentes de IA podemos esperar?
Crea también un agente para los usuarios gratuitos, para acelerar el despliegue.
¿Alguna noticia sobre una nueva versión de DALL-E?
Y por último, la pregunta que todo el mundo se hace... ¿cuándo se alcanzará la AGI?
Kevin Weil: Pronto saldrán más agentes, y creo que estaréis contentos con ellos. La generación de imágenes basada en 4o está a unos meses vista, y estoy impaciente por enseñárosla. Es realmente genial.
AGI sucederá.
¿Habrá grandes mejoras en GPT-4o? Me gusta mucho la GPT personalizada, y sería estupendo que se pudiera actualizar, o que pudiéramos elegir qué modelo utilizar en la GPT personalizada (por ejemplo, o3 mini).
Michelle Pokrass: Sí, ¡todavía no hemos terminado con la serie 4o!
¿Habrá una actualización del modo de voz avanzado? ¿Será éste un punto central de GPT-5o?
Sam Altman: ¡Sí, habrá una actualización del modo de voz avanzado!
Lo llamaremos GPT-5, no GPT-5o. Aún no hay calendario.
¿Qué importancia tuvo el éxito de Stargate para el futuro de OpenAI?
Kevin Weil: Muy importante. Todo lo que hemos visto sugiere que cuanta más potencia de cálculo tengamos, mejores modelos podremos construir y más productos valiosos podremos crear. Ahora estamos ampliando los modelos en dos dimensiones a la vez -mayor preentrenamiento y más aprendizaje por refuerzo (RL)/"fresa" (probablemente algún tipo de tecnología o nombre en clave del proyecto)- y ambas requieren potencia de cálculo.
También lo es suministrar productos a cientos de millones de usuarios. Y esto requiere potencia de cálculo a medida que avanzamos hacia productos más inteligentes que puedan trabajar para los usuarios de forma continuada. Así que piensa en Stargate como nuestra fábrica que convierte la electricidad o las GPU en grandes productos.