zddeepseeker - Deepseek R1 - Página 2 de 3

Sin categoría

Se revela la tecnología DeepSeek-R1: se desglosan los principios básicos del artículo y se revela la clave para el rendimiento innovador del modelo

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

Hoy compartiremos DeepSeek R1, Título: DeepSeek-R1: Incentivar la capacidad de razonamiento en LLM a través del aprendizaje de refuerzo: Incentivar la capacidad de razonamiento de LLM a través del aprendizaje de refuerzo. Este artículo presenta la primera generación de modelos de razonamiento de DeepSeek, DeepSeek-R1-Zero y DeepSeek-R1. El modelo DeepSeek-R1-Zero se entrenó a través del aprendizaje de refuerzo a gran escala (RL) sin ajuste fino supervisado (SFT) como paso inicial,…

Sin categoría

Interpretación del documento DeepSeek R1 y puntos técnicos clave

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

1 Antecedentes Durante el Festival de Primavera, DeepSeek R1 volvió a atraer la atención de todos, e incluso el artículo de interpretación de DeepSeek V3 que escribimos anteriormente también fue retransmitido y discutido mucho. Aunque ha habido muchos análisis y reproducciones de DeepSeek R1, aquí hemos decidido recopilar algunas notas de lectura correspondientes. Usaremos tres…

El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

Sin categoría

El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

El alto costo de usar modelos de IA de gran tamaño es una de las principales razones por las que muchas aplicaciones de IA aún no se han implementado ni promovido. Elegir un rendimiento extremo implica enormes costos de potencia de procesamiento, lo que genera altos costos de uso que los usuarios comunes no pueden aceptar. La competencia por los modelos de IA de gran tamaño es como una guerra sin humo. Después de…

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

Sin categoría

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

¡La familia Google Gemini 2.0 está finalmente completa! Domina las listas desde su lanzamiento. En medio de la persecución y los bloqueos de Deepseek, Qwen y o3, Google lanzó tres modelos de una sola vez esta mañana temprano: Gemini 2.0 Pro, Gemini 2.0 Flash y Gemini 2.0 Flash-Lite. En la clasificación de modelos grandes de LMSYS, Gemini…

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Sin categoría

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

Aspectos destacados Un agente de IA transforma la experiencia del cliente Jesse Zhang: ¿Cómo se construye realmente un agente? Nuestra opinión es que, con el tiempo, se parecerá cada vez más a un agente basado en lenguaje natural, porque así es como se entrenan los grandes modelos de lenguaje (LLM). A largo plazo, si tienes un agente superinteligente que…

Sin categoría

Cathie Wood: DeepSeek simplemente está acelerando el proceso de reducción de costos; la estructura de mercado extremadamente concentrada comparable a la Gran Depresión cambiará

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

Lo más destacado La competencia con DeepSeek es buena para EE. UU. Cathie Wood: Creo que demuestra que el coste de la innovación está cayendo drásticamente y que esta tendencia ya ha comenzado. Por ejemplo, antes de DeepSeek, el coste de entrenamiento de la inteligencia artificial se reducía en 75% por año, y el coste de la inferencia incluso se redujo en 85%…

Sin categoría

Google ha lanzado tres nuevos modelos a la vez: Gemini-2.0-Pro es gratuito, tiene una puntuación sobresaliente y ocupa el primer lugar, ¡y es adecuado para codificar y procesar indicaciones complejas!

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

La historia de Gemini 2.0 se está acelerando. La versión Flash Thinking Experimental de diciembre trajo a los desarrolladores un modelo funcional con baja latencia y alto rendimiento. A principios de este año, la versión 2.0 Flash Thinking Experimental se actualizó en Google AI Studio para mejorar aún más el rendimiento al combinar la velocidad de Flash con capacidades de inferencia mejoradas. La semana pasada,…

Sin categoría

Ali Qwen2.5-Max supera a DeepSeek-V3. Internauta: La IA de China está acortando la brecha rápidamente

Porzddeepseeker 5 de febrero de 20255 de febrero de 2025

Hace poco, otro modelo doméstico se sumó a la lista Big Model Arena de Ali, Qwen2.5-Max, que superó a DeepSeek-V3 y se ubicó en el séptimo lugar en la clasificación general con una puntuación total de 1332. También superó a modelos como Claude 3.5 Sonnet y Llama 3.1 405B de un solo golpe. En particular, se destaca en programación…

¡Últimas noticias! Un investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 cero durante las vacaciones del Año Nuevo chino

Sin categoría

¡Últimas noticias! Un investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 cero durante las vacaciones del Año Nuevo chino

Porzddeepseeker 4 de febrero de 20254 de febrero de 2025

¡Últimas noticias! El investigador de DeepSeek revela en línea: el entrenamiento de R1 solo tomó dos o tres semanas, y se observó una poderosa evolución de R1 zero durante las vacaciones del Año Nuevo chino Hace un momento, notamos que el investigador de DeepSeek, Daya Guo, respondió a las preguntas de los internautas sobre DeepSeek R1 y los planes de la compañía para el futuro. Solo podemos decir…

DeepSeek R1 quedó primero en la prueba de escritura creativa, ¡y o3 mini fue incluso peor que o1 mini!

Sin categoría

DeepSeek R1 quedó primero en la prueba de escritura creativa, ¡y o3 mini fue incluso peor que o1 mini!

Porzddeepseeker 3 de febrero de 20253 de febrero de 2025

DeepSeek R1 ha ganado el campeonato de la prueba de referencia de escritura creativa de relatos cortos, superando con éxito al anterior dominador, Claude 3.5 Sonnet. Prueba de referencia La prueba de referencia diseñada por el investigador Lech Mazur no es una competición de escritura al uso. Cada modelo de IA debía completar 500 relatos cortos, y cada relato tenía que incorporar ingeniosamente...