El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

El alto costo de usar modelos de IA de gran tamaño es una de las principales razones por las que muchas aplicaciones de IA aún no se han implementado ni promovido. Elegir un rendimiento extremo implica enormes costos de potencia de procesamiento, lo que genera altos costos de uso que los usuarios comunes no pueden aceptar. La competencia por los modelos de IA de gran tamaño es como una guerra sin humo. Después de…

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

¡La familia Google Gemini 2.0 está finalmente completa! Domina las listas desde su lanzamiento. En medio de la persecución y los bloqueos de Deepseek, Qwen y o3, Google lanzó tres modelos de una sola vez esta mañana temprano: Gemini 2.0 Pro, Gemini 2.0 Flash y Gemini 2.0 Flash-Lite. En la clasificación de modelos grandes de LMSYS, Gemini…

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Aspectos destacados Un agente de IA transforma la experiencia del cliente Jesse Zhang: ¿Cómo se construye realmente un agente? Nuestra opinión es que, con el tiempo, se parecerá cada vez más a un agente basado en lenguaje natural, porque así es como se entrenan los grandes modelos de lenguaje (LLM). A largo plazo, si tienes un agente superinteligente que…

Cathie Wood: DeepSeek simplemente está acelerando el proceso de reducción de costos; la estructura de mercado extremadamente concentrada comparable a la Gran Depresión cambiará

Lo más destacado La competencia con DeepSeek es buena para EE. UU. Cathie Wood: Creo que demuestra que el coste de la innovación está cayendo drásticamente y que esta tendencia ya ha comenzado. Por ejemplo, antes de DeepSeek, el coste de entrenamiento de la inteligencia artificial se reducía en 75% por año, y el coste de la inferencia incluso se redujo en 85%…

Google ha lanzado tres nuevos modelos a la vez: Gemini-2.0-Pro es gratuito, tiene una puntuación sobresaliente y ocupa el primer lugar, ¡y es adecuado para codificar y procesar indicaciones complejas!

La historia de Gemini 2.0 se está acelerando. La versión Flash Thinking Experimental de diciembre trajo a los desarrolladores un modelo funcional con baja latencia y alto rendimiento. A principios de este año, la versión 2.0 Flash Thinking Experimental se actualizó en Google AI Studio para mejorar aún más el rendimiento al combinar la velocidad de Flash con capacidades de inferencia mejoradas. La semana pasada,…

Ali Qwen2.5-Max supera a DeepSeek-V3. Internauta: La IA de China está acortando la brecha rápidamente

Hace poco, otro modelo doméstico se sumó a la lista Big Model Arena de Ali, Qwen2.5-Max, que superó a DeepSeek-V3 y se ubicó en el séptimo lugar en la clasificación general con una puntuación total de 1332. También superó a modelos como Claude 3.5 Sonnet y Llama 3.1 405B de un solo golpe. En particular, se destaca en programación…

¡Últimas noticias! Un investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 cero durante las vacaciones del Año Nuevo chino

¡Últimas noticias! Un investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 cero durante las vacaciones del Año Nuevo chino

¡Últimas noticias! El investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 zero durante las vacaciones del Año Nuevo chino Hace un momento, notamos que el investigador de DeepSeek, Daya Guo, respondió a las preguntas de los internautas sobre DeepSeek R1 y los planes de la compañía para el futuro. Solo podemos decir…

DeepSeek R1 quedó primero en la prueba de escritura creativa, ¡y o3 mini fue incluso peor que o1 mini!

DeepSeek R1 quedó primero en la prueba de escritura creativa, ¡y o3 mini fue incluso peor que o1 mini!

DeepSeek R1 ha ganado el campeonato de la prueba de referencia de escritura creativa de relatos cortos, superando con éxito al anterior dominador, Claude 3.5 Sonnet. Prueba de referencia La prueba de referencia diseñada por el investigador Lech Mazur no es una competición de escritura al uso. Cada modelo de IA debía completar 500 relatos cortos, y cada relato tenía que incorporar ingeniosamente...

¿Cómo se creó DeepSeek? Un análisis de la historia del crecimiento de DeepSeek

¿Cómo se creó DeepSeek? Un análisis de la historia del crecimiento de DeepSeek

En el futuro, la innovación será cada vez más dura. Puede que ahora no sea fácil de entender, porque todo el grupo social necesita educarse con hechos. Cuando esta sociedad permita triunfar a las personas que innovan a fondo, la mentalidad colectiva cambiará. Sólo necesitamos un puñado de hechos y un proceso....

¡DeepSeek lo ha conseguido! OpenAI admite un error de código cerrado, la ventaja de la vanguardia se reduce

¡DeepSeek lo ha conseguido! OpenAI admite un error de código cerrado, la ventaja de la vanguardia se reduce

Después de que OpenAI lanzara el modelo o3-mini, su consejero delegado, Sam Altman; el director de investigación, Mark Chen; el director de producto, Kevin Weil; el vicepresidente de ingeniería, Srinivas Narayanan; la directora de investigación de API, Michelle Pokrass, y el director de investigación, Hongyu Ren, llevaron a cabo una sesión de preguntas y respuestas técnicas en línea en reddit, uno de los foros más completos del mundo. Los temas principales...