En los últimos días, Deepseek-R1 0528 se ha publicado oficialmente en código abierto. En LiveCodeBench, su rendimiento es casi comparable al o3 (alto) de OpenAI; en la prueba de referencia multilingüe de Aider, se mantiene a la par con Claude Opus. Cuando se lanzó en el sitio web oficial, probamos rápidamente sus capacidades de frontend y las descubrimos excepcionalmente...
El modelo DeepSeek R1 ha sido sometido a una pequeña actualización de versión, y la versión actual es la DeepSeek-R1-0528. Al acceder a la página web o la aplicación de DeepSeek, active la función "Pensamiento profundo" en la interfaz de diálogo para experimentar la última versión. Los pesos del modelo DeepSeek-R1-0528 se han subido a HuggingFace. Durante los últimos cuatro meses, el DeepSeek-R1 ha sido sometido a…
La semana pasada, DeepSeek anunció que abriría el código fuente de cinco proyectos la próxima semana: Los internautas dijeron: "Esta vez, OpenAI realmente está aquí". Justo ahora, llegó el primer proyecto de código abierto, relacionado con la aceleración de inferencia, FlashMLA: Dirección del proyecto de código abierto: DeepSeek FlashMLA Ha sido de código abierto durante dos horas y Github ya tiene más de 2.7k estrellas: El…
FlashMLA ha ganado rápidamente atención en el mundo de la inteligencia artificial, particularmente en el campo de los modelos de lenguaje grandes (LLM). Esta innovadora herramienta, desarrollada por DeepSeek, sirve como un núcleo de decodificación optimizado diseñado para GPU Hopper, chips de alto rendimiento que se usan comúnmente en cálculos de IA. FlashMLA se centra en el procesamiento eficiente de secuencias de longitud variable, lo que lo hace particularmente adecuado…