¡DeepSeek lo ha conseguido! OpenAI admite un error de código cerrado, la ventaja de la vanguardia se hace más pequeña

En OpenAI lanzó el modelo o3-miniEl Director General, Sam Altman, el Director de Investigación, Mark Chen, y el Director de Producto, Kevin Weil;

El Vicepresidente de Ingeniería, Srinivas Narayanan, la Directora de Investigación de API, Michelle Pokrass, y el Director de Investigación, Hongyu Ren, llevaron a cabo una sesión de preguntas y respuestas técnicas en reddit, uno de los foros más completos del mundo.

Los principales temas tratados fueron la situación actual de OpenAI, la planificación de futuros productos y el fenómeno global del gran modelo DeepSeek-R1.

Las mejores preguntas

Un usuario preguntó: "¿Podemos ver todas las fichas de pensamiento del modelo grande?".

Sam Altman: "Sí, pronto mostraremos una versión más útil y detallada. Esto es gracias a una actualización en R1.

Kevin Weil: Estamos trabajando para mostrar más de lo que mostramos hoy - esto sucederá pronto. La forma exacta de mostrar todo el contenido está aún por determinar, pero mostrar todas las cadenas de pensamiento podría conducir a un refinamiento competitivo.

Pero también sabemos que la gente (al menos los usuarios avanzados) quiere ver esto, así que encontraremos la forma adecuada de equilibrarlo.

Srinivas Narayanan: Estamos buscando maneras de mostrar más del proceso de pensamiento. Estén atentos.

¿Considerará la posibilidad de dar a conocer algunos modelos de pesos y publicar algunas investigaciones?

Sam Altman: Sí, lo estamos debatiendo. Creo que elegimos el lado históricamente equivocado del código cerrado y tenemos que idear una estrategia de código abierto diferente. No todo el mundo comparte esta opinión, y no es nuestra máxima prioridad en este momento.

Hablemos del tema candente de esta semana, Deepseek. Obviamente, se trata de un modelo impresionante, y sé que probablemente fue entrenado con los resultados de otros grandes modelos. ¿Cómo afectará esto a sus planes para futuros modelos?

Sam Altman: Es un modelo muy bueno. Desarrollaremos modelos mejores, pero nuestra ventaja será menor que en años anteriores.

Supongamos que estamos en 2030 y usted acaba de crear un sistema general de inteligencia artificial (AGI). Sobresale en todas las pruebas de referencia que usted establece, superando a sus mejores ingenieros e investigadores tanto en velocidad como en rendimiento. ¿Y ahora qué? ¿Algún plan más allá de "lanzarlo en la web"?

Sam Altman: El impacto más importante, en mi opinión, será acelerar los descubrimientos científicos, porque creo que es el factor que más contribuirá a mejorar la calidad de vida.

Srinivas Narayanan: La interfaz a través de la cual interactuamos con la IA cambiará radicalmente. La IA será más autónoma y procesará continuamente tareas y objetivos complejos por nosotros en segundo plano.

Sólo se pondrán en contacto con nosotros cuando sea necesario. La robótica también debería haber avanzado lo suficiente como para poder realizar tareas útiles para nosotros en el mundo real. (A juzgar por esta respuesta, AI Agent es, de hecho, uno de los mejores casos de uso para AGI).

Al parecer, las funciones avanzadas de diálogo de voz han disminuido desde que se lanzó la función de vídeo. Hay algún plan para arreglar o mejorar esto?

Srinivas Narayanan: Gracias por el comentario, lo estudiaremos.

¿Por qué el plazo de conocimiento de la o3 - mini ¿todavía en octubre de 2023? ¿Es también el caso del o3 o del o3 Pro? ¿Hay algún plan para actualizar el plazo de conocimiento?

Antes de pagar la suscripción Plus, la fecha límite de conocimientos para GPT - 4o era junio de 2024, pero ahora que he pagado, la fecha límite de conocimientos ha vuelto a octubre de 2023. ¿Por qué ocurre esto?

Sam Altman: Ahora que hemos activado la búsqueda, esto (la fecha de caducidad de los conocimientos) es menos importante. Personalmente, nunca volveré a pensar en la fecha de caducidad de los conocimientos.

¿Qué otros agentes de IA podemos esperar?

Crea también un agente para los usuarios gratuitos, para acelerar el despliegue.

¿Alguna noticia sobre una nueva versión de DALL-E?

Y por último, la pregunta que todo el mundo se hace... ¿cuándo se alcanzará la AGI?

Kevin Weil: Pronto saldrán más agentes, y creo que estaréis contentos con ellos. La generación de imágenes basada en 4o está a unos meses vista, y estoy impaciente por enseñárosla. Es realmente genial.

AGI sucederá.

¿Habrá grandes mejoras en GPT-4o? Me gusta mucho la GPT personalizada, y sería estupendo que se pudiera actualizar, o que pudiéramos elegir qué modelo utilizar en la GPT personalizada (por ejemplo, o3 mini).

Michelle Pokrass: Sí, ¡todavía no hemos terminado con la serie 4o!

¿Habrá una actualización del modo de voz avanzado? ¿Será éste un punto central de GPT-5o?

Sam Altman: ¡Sí, habrá una actualización del modo de voz avanzado!

Lo llamaremos GPT-5, no GPT-5o. Aún no hay calendario.

¿Qué importancia tuvo el éxito de Stargate para el futuro de OpenAI?

Kevin Weil: Muy importante. Todo lo que hemos visto sugiere que cuanta más potencia de cálculo tengamos, mejores modelos podremos construir y más productos valiosos podremos crear. Ahora estamos ampliando los modelos en dos dimensiones a la vez -mayor preentrenamiento y más aprendizaje por refuerzo (RL)/"fresa" (probablemente algún tipo de tecnología o nombre en clave del proyecto)- y ambas requieren potencia de cálculo.

También lo es suministrar productos a cientos de millones de usuarios. Y esto requiere potencia de cálculo a medida que avanzamos hacia productos más inteligentes que puedan trabajar para los usuarios de forma continuada. Así que piensa en Stargate como nuestra fábrica que convierte la electricidad o las GPU en grandes productos.

Entradas Similares

Sin categoría

¿Qué es FlashMLA? Una guía completa sobre su impacto en los núcleos de decodificación de IA

Pordeepseeker 24 de febrero de 202524 de febrero de 2025

FlashMLA ha ganado rápidamente atención en el mundo de la inteligencia artificial, particularmente en el campo de los modelos de lenguaje grandes (LLM). Esta innovadora herramienta, desarrollada por DeepSeek, sirve como un núcleo de decodificación optimizado diseñado para GPU Hopper, chips de alto rendimiento que se usan comúnmente en cálculos de IA. FlashMLA se centra en el procesamiento eficiente de secuencias de longitud variable, lo que lo hace particularmente adecuado…

Sin categoría

OpenAI o3-mini vs. DeepSeek-R1: ¿Quién es el rey de la nueva generación de modelos de IA?

Porzddeepseeker 1 de febrero de 20251 de febrero de 2025

o3-mini está aquí, con el ímpetu de un aspirante El 31 de enero, OpenAI lanzó el nuevo modelo grande o3-mini y proporcionó algunas de sus funciones de forma gratuita a todos los usuarios de ChatGPT. Aunque hay un límite en el número de consultas, permite a los usuarios experimentar el último modelo comercial de OpenAI lo antes posible.....

Sin categoría

Cathie Wood: DeepSeek simplemente está acelerando el proceso de reducción de costos; la estructura de mercado extremadamente concentrada comparable a la Gran Depresión cambiará

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

Lo más destacado La competencia con DeepSeek es buena para EE. UU. Cathie Wood: Creo que demuestra que el coste de la innovación está cayendo drásticamente y que esta tendencia ya ha comenzado. Por ejemplo, antes de DeepSeek, el coste de entrenamiento de la inteligencia artificial se reducía en 75% por año, y el coste de la inferencia incluso se redujo en 85%…

Sin categoría

Interpretación del documento DeepSeek R1 y puntos técnicos clave

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

1 Antecedentes Durante el Festival de Primavera, DeepSeek R1 volvió a atraer la atención de todos, e incluso el artículo de interpretación de DeepSeek V3 que escribimos anteriormente también fue retransmitido y discutido mucho. Aunque ha habido muchos análisis y reproducciones de DeepSeek R1, aquí hemos decidido recopilar algunas notas de lectura correspondientes. Usaremos tres…

Sin categoría

Le Chat encabeza la lista, con una inversión de cien mil millones de dólares. ¿Es la tercera potencia en inteligencia artificial después de Estados Unidos y China?

Porzddeepseeker 11 de febrero de 202511 de febrero de 2025

El 9 de febrero, el presidente francés, Emmanuel Macron, anunció que Francia invertirá 109.000 millones de euros (113.000 millones de dólares) en el campo de la IA en los próximos años. Esta inversión se utilizará para construir un parque de IA en Francia, mejorar la infraestructura e invertir en empresas emergentes locales de IA. Mientras tanto, Mistral, una startup francesa,…

Sin categoría

DeepSeek TOP17 Mejores alternativas: análisis exhaustivo (2025)

Pordeepseeker 6 de febrero de 20256 de febrero de 2025

Introducción En el panorama de la inteligencia artificial, que evoluciona rápidamente, DeepSeek ha surgido como un modelo de lenguaje poderoso. Este análisis exhaustivo explora las 17 principales alternativas a DeepSeek y examina sus características, capacidades y casos de uso únicos. Nuestra investigación se centra en plataformas internacionales y chinas que ofrecen integración con DeepSeek o capacidades similares. Análisis de las principales alternativas 1….

¡DeepSeek lo ha conseguido! OpenAI admite un error de código cerrado, la ventaja de la vanguardia se reduce

Las mejores preguntas

¿Qué es FlashMLA? Una guía completa sobre su impacto en los núcleos de decodificación de IA

OpenAI o3-mini vs. DeepSeek-R1: ¿Quién es el rey de la nueva generación de modelos de IA?

Cathie Wood: DeepSeek simplemente está acelerando el proceso de reducción de costos; la estructura de mercado extremadamente concentrada comparable a la Gran Depresión cambiará

Interpretación del documento DeepSeek R1 y puntos técnicos clave

Le Chat encabeza la lista, con una inversión de cien mil millones de dólares. ¿Es la tercera potencia en inteligencia artificial después de Estados Unidos y China?

DeepSeek TOP17 Mejores alternativas: análisis exhaustivo (2025)

Deja una respuesta Cancelar la respuesta