Non classé - Deepseek R1

Le duel des quatre meilleurs modèles ! Un test met en lumière la puissance du Deepseek R1.

Parzddeepseeker 1er juin 20251er juin 2025

Ces derniers jours, Deepseek-R1 0528 a été officiellement mis en open source. Sur LiveCodeBench, ses performances sont quasiment équivalentes à celles d'OpenAI (o3, niveau élevé) ; dans le test de performance multilingue d'Aider, il tient tête à Claude Opus. Lors de son lancement sur le site officiel, nous avons rapidement testé ses fonctionnalités front-end et les avons trouvées exceptionnellement…

Non classé

Mise à jour DeepSeek-R1-0528 : Réflexion plus approfondie, raisonnement plus solide

Parzddeepseeker 29 mai 202529 mai 2025

Le modèle DeepSeek R1 a bénéficié d'une mise à jour mineure, la version actuelle étant la DeepSeek-R1-0528. Lorsque vous accédez à la page web ou à l'application DeepSeek, activez la fonction « Réflexion approfondie » dans l'interface de dialogue pour découvrir la dernière version. Les poids du modèle DeepSeek-R1-0528 ont été téléchargés sur HuggingFace. Au cours des quatre derniers mois, le DeepSeek-R1 a bénéficié…

Non classé

DeepSeek a publié son code source et une explication détaillée de FlashMLA

Parzddeepseeker 24 février 202524 février 2025

La semaine dernière, DeepSeek a annoncé qu'il ouvrirait la source de cinq projets la semaine prochaine : les internautes ont déclaré : « Cette fois, OpenAI est vraiment là. » Tout à l'heure, le premier projet open source est arrivé, lié à l'accélération de l'inférence, FlashMLA : Adresse du projet open source : DeepSeek FlashMLA Il est open source depuis deux heures, et Github a déjà plus de 2,7 k étoiles : Le…

Non classé

Qu'est-ce que FlashMLA ? Un guide complet sur son impact sur les noyaux de décodage de l'IA

Pardeepseeker 24 février 202524 février 2025

FlashMLA a rapidement attiré l’attention dans le monde de l’intelligence artificielle, notamment dans le domaine des grands modèles de langage (LLM). Cet outil innovant, développé par DeepSeek, sert de noyau de décodage optimisé conçu pour les GPU Hopper, des puces hautes performances couramment utilisées dans les calculs d’IA. FlashMLA se concentre sur le traitement efficace de séquences de longueur variable, ce qui le rend particulièrement bien adapté…

Non classé

Qwen2.5-max vs DeepSeek R1 : une comparaison approfondie des modèles : une analyse complète des scénarios d'application

Parzddeepseeker 14 février 202514 février 2025

Introduction Aujourd'hui, les grands modèles de langage (LLM) jouent un rôle crucial. Début 2025, alors que la concurrence pour l'IA s'intensifiait, Alibaba a lancé le nouveau modèle d'IA Qwen2.5-max, et DeepSeek, une société de Hangzhou, en Chine, a lancé le modèle R1, qui représente le summum de la technologie LLM. Deepseek R1 est un modèle d'IA open source qui a attiré…

Non classé

Il est proche de DeepSeek-R1-32B et écrase le s1 de Fei-Fei Li ! UC Berkeley et d'autres nouveaux modèles d'inférence SOTA open source

Parzddeepseeker 14 février 202514 février 2025

Le modèle d'inférence 32B n'utilise que 1/8 des données et est à égalité avec DeepSeek-R1 de la même taille ! À l'heure actuelle, des institutions telles que Stanford, UC Berkeley et l'Université de Washington ont publié conjointement un modèle d'inférence de niveau SOTA, OpenThinker-32B, et ont également ouvert le code source de jusqu'à 114 000 données d'entraînement. Page d'accueil du projet OpenThinker : OpenThinker Hugging Face :…

Non classé

Artefacts de gestion de grands modèles de langage tels que DeepSeek : Cherry Studio, Chatbox, AnythingLLM, qui est votre accélérateur d'efficacité ?

Parzddeepseeker 11 février 202511 février 2025

De nombreuses personnes ont déjà commencé à déployer et à utiliser les modèles de langage larges Deepseek localement, en utilisant Chatbox comme outil de visualisation. Cet article continuera à présenter deux autres artefacts de gestion et de visualisation de modèles de langage larges d'IA, et comparera les trois en détail pour vous aider à utiliser les modèles de langage larges d'IA plus efficacement. En 2025,…

Non classé

Le Chat arrive en tête des classements avec un investissement de cent milliards de dollars. Après les Etats-Unis et la Chine, est-il la troisième puissance de l'IA ?

Parzddeepseeker 11 février 202511 février 2025

Le 9 février, le président français Emmanuel Macron a annoncé que la France investirait 109 milliards d’euros (113 milliards de dollars américains) dans le domaine de l’IA au cours des prochaines années. Cet investissement servira à construire un parc d’IA en France, à améliorer les infrastructures et à investir dans des start-ups locales en IA. Pendant ce temps, Mistral, une start-up française,…

Non classé

Que peut accomplir Deepseek ? Même OpenAI n'y arrive pas ?

Parzddeepseeker 10 février 202510 février 2025

La véritable valeur de DeepSeek est sous-estimée ! DeepSeek-R1 a sans aucun doute apporté une nouvelle vague d'enthousiasme sur le marché. Non seulement les cibles de bénéficiaires concernées augmentent considérablement, mais certaines personnes ont même développé des cours et des logiciels liés à DeepSeek pour tenter d'en tirer profit. Nous pensons que bien que ces phénomènes aient un impact…

Non classé

Les principaux produits d'IA du monde se concentrent sur l'analyse et les directives complètes en matière d'expérience utilisateur (y compris DeepSeek et GPT)

Parzddeepseeker 10 février 202510 février 2025

Analyse des avantages de base et positionnement des fonctions ChatGPT (OpenAI) – la référence mondiale pour les polyvalents ChatGPT Gènes techniques : IA générative basée sur la série GPT de grands modèles, avec des compétences conversationnelles générales et un raisonnement logique comme principaux avantages. Traitement multilingue : fonctionne mieux en anglais, avec une amélioration continue en chinois ; mais nous recommandons d'utiliser l'anglais pour…