Non classé - Deepseek R1

Le secret derrière DeepSeek 1 | DeepSeekMath et les détails du GRPO

Non classé

Le secret derrière DeepSeek 1 | DeepSeekMath et les détails du GRPO

Parzddeepseeker 9 février 20259 février 2025

Aujourd'hui, j'aimerais partager un article de DeepSeek, intitulé DeepSeekMath : repousser les limites du raisonnement mathématique dans les modèles de langage ouvert. Cet article présente DeepSeekMath 7B, qui est pré-entraîné sur DeepSeek-Coder-Base-v1.5 7B basé sur une collection de 120 B de jetons liés aux mathématiques, de langage naturel et de données de code. Le modèle a obtenu un score étonnant de 51,71 TP11T au niveau compétitif…

Non classé

La technologie DeepSeek-R1 dévoilée : les principes fondamentaux de l'article sont décomposés et la clé des performances révolutionnaires du modèle est révélée

Parzddeepseeker 9 février 20259 février 2025

Aujourd'hui, nous allons partager DeepSeek R1, titre : DeepSeek-R1 : Incitation à la capacité de raisonnement dans les LLM via l'apprentissage par renforcement : Incitation à la capacité de raisonnement des LLM via l'apprentissage par renforcement. Cet article présente la première génération de modèles de raisonnement de DeepSeek, DeepSeek-R1-Zero et DeepSeek-R1. Le modèle DeepSeek-R1-Zero a été formé par apprentissage par renforcement à grande échelle (RL) sans réglage fin supervisé (SFT) comme étape initiale,…

Non classé

Interprétation du document DeepSeek R1 et points techniques clés

Parzddeepseeker 9 février 20259 février 2025

1 Contexte Au cours du Festival du Printemps, DeepSeek R1 a de nouveau attiré l'attention, et même l'article d'interprétation de DeepSeek V3 que nous avons écrit précédemment a également été retransmis et beaucoup discuté. Bien qu'il y ait eu de nombreuses analyses et reproductions de DeepSeek R1, nous avons décidé ici de compiler quelques notes de lecture correspondantes. Nous utiliserons trois…

Le modèle low cost de Google, la série Gemini 2.0, attaque : la bataille pour la rentabilité des grands modèles s'intensifie

Non classé

Le modèle low cost de Google, la série Gemini 2.0, attaque : la bataille pour la rentabilité des grands modèles s'intensifie

Parzddeepseeker 8 février 20258 février 2025

Le coût élevé de l’utilisation de grands modèles d’IA est l’une des principales raisons pour lesquelles de nombreuses applications d’IA n’ont pas encore été mises en œuvre et promues. Le choix de performances extrêmes implique des coûts de puissance de calcul énormes, ce qui entraîne des coûts d’utilisation élevés que les utilisateurs ordinaires ne peuvent pas accepter. La compétition pour les grands modèles d’IA est comme une guerre sans fumée. Après…

Gemini 2.0 domine les charts, tandis que DeepSeek V3 pleure son prix, et un nouveau champion économique est né !

Non classé

Gemini 2.0 domine les charts, tandis que DeepSeek V3 pleure son prix, et un nouveau champion économique est né !

Parzddeepseeker 8 février 20258 février 2025

La famille Google Gemini 2.0 est enfin au complet ! Elle domine les classements dès sa sortie. Au milieu de la poursuite et des blocages de Deepseek, Qwen et o3, Google a sorti trois modèles d'un coup tôt ce matin : Gemini 2.0 Pro, Gemini 2.0 Flash et Gemini 2.0 Flash-Lite. Dans le classement des grands modèles LMSYS, Gemini…

Dialogue d'a16z avec le PDG de 27 ans : l'agent IA a un effet de levier énorme et la tarification à long terme sera liée aux coûts de main-d'œuvre

Non classé

Dialogue d'a16z avec le PDG de 27 ans : l'agent IA a un effet de levier énorme et la tarification à long terme sera liée aux coûts de main-d'œuvre

Parzddeepseeker 8 février 20258 février 2025

Points forts L'agent IA remodèle l'expérience client Jesse Zhang : Comment un agent est-il réellement construit ? Nous pensons qu'au fil du temps, il ressemblera de plus en plus à un agent basé sur le langage naturel, car c'est ainsi que les grands modèles de langage (LLM) sont formés. À long terme, si vous avez un agent super intelligent qui…

Non classé

Cathie Wood : DeepSeek ne fait qu'accélérer le processus de réduction des coûts ; la structure de marché extrêmement concentrée comparable à celle de la Grande Dépression va changer

Parzddeepseeker 8 février 20258 février 2025

Points forts La concurrence avec DeepSeek est bonne pour les États-Unis Cathie Wood : Je pense que cela montre que le coût de l’innovation est en baisse spectaculaire et que cette tendance a déjà commencé. Par exemple, avant DeepSeek, le coût de la formation de l’intelligence artificielle a chuté de 75% par an, et le coût de l’inférence a même chuté de 85% pour atteindre 10 ...

Non classé

Google a publié trois nouveaux modèles à la fois : Gemini-2.0-Pro est gratuit, a un score exceptionnel et se classe au premier rang, et convient au codage et au traitement d'invites complexes !

Parzddeepseeker 8 février 20258 février 2025

L'histoire de Gemini 2.0 s'accélère. La version Flash Thinking Experimental de décembre a apporté aux développeurs un modèle fonctionnel avec une faible latence et des performances élevées. Plus tôt cette année, Flash Thinking Experimental 2.0 a été mis à jour dans Google AI Studio pour améliorer encore les performances en combinant la vitesse de Flash avec des capacités d'inférence améliorées. La semaine dernière,…

DeepSeek TOP17 Meilleures alternatives : analyse complète (2025)

Non classé

DeepSeek TOP17 Meilleures alternatives : analyse complète (2025)

Pardeepseeker 6 février 20256 février 2025

Introduction Dans le paysage en évolution rapide de l'intelligence artificielle, DeepSeek est apparu comme un modèle de langage puissant. Cette analyse complète explore les 17 meilleures alternatives à DeepSeek, en examinant leurs caractéristiques, capacités et cas d'utilisation uniques. Nos recherches se concentrent sur les plateformes internationales et chinoises qui offrent une intégration DeepSeek ou des capacités similaires. Analyse des meilleures alternatives 1….

Non classé

Ali Qwen2.5-Max dépasse DeepSeek-V3 ! Un internaute : l'IA chinoise comble rapidement l'écart

Parzddeepseeker 5 février 20255 février 2025

Tout à l'heure, un autre modèle national a été ajouté à la liste Big Model Arena d'Ali, le Qwen2.5-Max, qui a surpassé le DeepSeek-V3 et s'est classé septième au classement général avec un score total de 1332. Il a également surpassé d'un seul coup des modèles tels que Claude 3.5 Sonnet et Llama 3.1 405B. En particulier, il excelle dans la programmation…