Uncategorized - Deepseek R1

El secreto detrás de DeepSeek 1 | DeepSeekMath y detalles de GRPO

Sin categoría

El secreto detrás de DeepSeek 1 | DeepSeekMath y detalles de GRPO

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

Hoy me gustaría compartir un artículo de DeepSeek, titulado DeepSeekMath: Ampliando los límites del razonamiento matemático en modelos de lenguaje abierto. Este artículo presenta DeepSeekMath 7B, que está entrenado previamente en DeepSeek-Coder-Base-v1.5 7B en base a una colección de 120 mil millones de tokens relacionados con las matemáticas, lenguaje natural y datos de código. El modelo logró una asombrosa puntuación de 51,7% en el nivel competitivo...

Sin categoría

Se revela la tecnología DeepSeek-R1: se desglosan los principios básicos del artículo y se revela la clave para el rendimiento innovador del modelo

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

Hoy compartiremos DeepSeek R1, Título: DeepSeek-R1: Incentivar la capacidad de razonamiento en LLM a través del aprendizaje de refuerzo: Incentivar la capacidad de razonamiento de LLM a través del aprendizaje de refuerzo. Este artículo presenta la primera generación de modelos de razonamiento de DeepSeek, DeepSeek-R1-Zero y DeepSeek-R1. El modelo DeepSeek-R1-Zero se entrenó a través del aprendizaje de refuerzo a gran escala (RL) sin ajuste fino supervisado (SFT) como paso inicial,…

Sin categoría

Interpretación del documento DeepSeek R1 y puntos técnicos clave

Porzddeepseeker 9 de febrero de 20259 de febrero de 2025

1 Antecedentes Durante el Festival de Primavera, DeepSeek R1 volvió a atraer la atención de todos, e incluso el artículo de interpretación de DeepSeek V3 que escribimos anteriormente también fue retransmitido y discutido mucho. Aunque ha habido muchos análisis y reproducciones de DeepSeek R1, aquí hemos decidido recopilar algunas notas de lectura correspondientes. Usaremos tres…

El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

Sin categoría

El modelo low cost de Google, la serie Gemini 2.0, ataca: se intensifica la batalla por la rentabilidad en los modelos grandes

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

El alto costo de usar modelos de IA de gran tamaño es una de las principales razones por las que muchas aplicaciones de IA aún no se han implementado ni promovido. Elegir un rendimiento extremo implica enormes costos de potencia de procesamiento, lo que genera altos costos de uso que los usuarios comunes no pueden aceptar. La competencia por los modelos de IA de gran tamaño es como una guerra sin humo. Después de…

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

Sin categoría

Gemini 2.0 domina las listas, mientras que DeepSeek V3 llora por su precio, ¡y nace un nuevo campeón en cuanto a relación costo-beneficio!

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

¡La familia Google Gemini 2.0 está finalmente completa! Domina las listas desde su lanzamiento. En medio de la persecución y los bloqueos de Deepseek, Qwen y o3, Google lanzó tres modelos de una sola vez esta mañana temprano: Gemini 2.0 Pro, Gemini 2.0 Flash y Gemini 2.0 Flash-Lite. En la clasificación de modelos grandes de LMSYS, Gemini…

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Sin categoría

Diálogo de a16z con un director ejecutivo de 27 años: el agente de inteligencia artificial tiene un enorme efecto de palanca y los precios a largo plazo estarán vinculados a los costos laborales

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

Aspectos destacados Un agente de IA transforma la experiencia del cliente Jesse Zhang: ¿Cómo se construye realmente un agente? Nuestra opinión es que, con el tiempo, se parecerá cada vez más a un agente basado en lenguaje natural, porque así es como se entrenan los grandes modelos de lenguaje (LLM). A largo plazo, si tienes un agente superinteligente que…

Sin categoría

Cathie Wood: DeepSeek simplemente está acelerando el proceso de reducción de costos; la estructura de mercado extremadamente concentrada comparable a la Gran Depresión cambiará

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

Lo más destacado La competencia con DeepSeek es buena para EE. UU. Cathie Wood: Creo que demuestra que el coste de la innovación está cayendo drásticamente y que esta tendencia ya ha comenzado. Por ejemplo, antes de DeepSeek, el coste de entrenamiento de la inteligencia artificial se reducía en 75% por año, y el coste de la inferencia incluso se redujo en 85%…

Sin categoría

Google ha lanzado tres nuevos modelos a la vez: Gemini-2.0-Pro es gratuito, tiene una puntuación sobresaliente y ocupa el primer lugar, ¡y es adecuado para codificar y procesar indicaciones complejas!

Porzddeepseeker 8 de febrero de 20258 de febrero de 2025

La historia de Gemini 2.0 se está acelerando. La versión Flash Thinking Experimental de diciembre trajo a los desarrolladores un modelo funcional con baja latencia y alto rendimiento. A principios de este año, la versión 2.0 Flash Thinking Experimental se actualizó en Google AI Studio para mejorar aún más el rendimiento al combinar la velocidad de Flash con capacidades de inferencia mejoradas. La semana pasada,…

DeepSeek TOP17 Mejores alternativas: análisis exhaustivo (2025)

Sin categoría

DeepSeek TOP17 Mejores alternativas: análisis exhaustivo (2025)

Pordeepseeker 6 de febrero de 20256 de febrero de 2025

Introducción En el panorama de la inteligencia artificial, que evoluciona rápidamente, DeepSeek ha surgido como un modelo de lenguaje poderoso. Este análisis exhaustivo explora las 17 principales alternativas a DeepSeek y examina sus características, capacidades y casos de uso únicos. Nuestra investigación se centra en plataformas internacionales y chinas que ofrecen integración con DeepSeek o capacidades similares. Análisis de las principales alternativas 1….

Sin categoría

Ali Qwen2.5-Max supera a DeepSeek-V3. Internauta: La IA de China está acortando la brecha rápidamente

Porzddeepseeker 5 de febrero de 20255 de febrero de 2025

Hace poco, otro modelo doméstico se sumó a la lista Big Model Arena de Ali, Qwen2.5-Max, que superó a DeepSeek-V3 y se ubicó en el séptimo lugar en la clasificación general con una puntuación total de 1332. También superó a modelos como Claude 3.5 Sonnet y Llama 3.1 405B de un solo golpe. En particular, se destaca en programación…