Une comparaison complète de la nouvelle version d'OpenAI, o3-mini, et de DeepSeek R1

OpenAI a publié son dernier modèle d'inférence, o3-miniqui est optimisé pour des domaines tels que les sciences, les mathématiques et la programmation, offrant une réponse plus rapide, une plus grande précision et un coût moins élevé.

Par rapport à son prédécesseur o1-mini, o3-mini a considérablement amélioré ses capacités d'inférence, en particulier pour la résolution de problèmes complexes. Les testeurs préfèrent les réponses de o3-mini de 56%, et le taux d'erreur a été réduit de 39%. À partir d'aujourd'hui, ChatGPT Plus, équipe et Pro peuvent utiliser o3-mini, et utilisateurs gratuits peut également expérimenter certaines de ses fonctionnalités.

Par rapport au modèle d'inférence DeepSeek-R1La qualité de l'eau est donc bien meilleure que celle de l'eau de mer. OpenAI o3-mini que la R1 ?

Cet article donnera d'abord un aperçu des points forts de o3-mini, puis nous extrairons les données des deux côtés sur chaque point de référence et nous ferons un graphique pour les comparer visuellement. En outre, nous comparerons également le prix de o3-mini.

Table des matières

Points forts

1.Optimisation des STIM: il excelle dans les domaines des mathématiques, de la programmation, de la science, etc., et surpasse en particulier o1-mini dans le mode d'effort d'inférence élevé.

2.Fonctions du développeurLe système de gestion de l'information (SGI) : prend en charge des fonctions telles que les appels de fonction, les sorties structurées et les messages de développeur pour répondre aux besoins de l'environnement de production.

3.Réponse rapideLe temps de réponse de 24% est plus rapide que celui de o1-mini, avec un temps de réponse de 7,7 secondes par requête.

4.Amélioration de la sécurité: garantit une production sûre et fiable grâce à une technologie d'alignement en profondeur.

5.RentabilitéLes capacités d'inférence et l'optimisation des coûts vont de pair, ce qui réduit considérablement le seuil d'utilisation de l'IA.

Comparer

Open AI Afin de mettre en valeur sa classe, son blog officiel ne le compare qu'avec ses propres modèles. Cet article est donc un tableau extrait de l'article DeepSeek R1 et des données du blog officiel d'OpenAI.

OpenAI compare officiellement o3-mini dans la liste des versions, en la divisant en trois versions : faible, moyenne et élevée, qui indiquent la force de l'inférence. Étant donné que DeepSeek utilise Math-500 et qu'OpenAI utilise l'ensemble de données Math, cette comparaison a été supprimée ici.

Un graphique est plus intuitif, et Codeforces a été supprimé parce que les valeurs sont trop grandes pour être affichées de manière intuitive. Toutefois, la comparaison sur Codeforces montre que la force d'inférence élevée d'o3-mini n'est pas très importante.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Vérifié

D'après le graphique, il y a au total 4 comparaisons, et l'O3-mini (haut) est généralement en tête, mais l'avance est très faible.

Prix

modèle	Prix des intrants	Cache hit	Prix à la production
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Résumé

Le DeepSeek R1 ayant déclenché la panique du DeepSeek aux États-Unis, OpenAI a été la première à se sentir menacée, ce qui est particulièrement évident dans la tarification de son nouveau modèle o3-mini.

Lors de la sortie d'Openai o1, son prix élevé a mis la pression sur de nombreux développeurs et utilisateurs. L'apparition de DeepSeek R1 a donné plus de choix à chacun.De la différence de prix de 30 fois entre o1 et R1 au prix final de o3-mini qui est deux fois plus élevé que celui de o3-mini. le prix de DeepSeek R1,

montre l'impact de DeepSeek R1 sur openai.Cependant, les utilisateurs gratuits de ChatGPT ne peuvent expérimenter o3-mini que de manière limitée, tandis que la fonction Deep Thinking de DeepSeek est actuellement disponible pour tous les utilisateurs.Je me réjouis également que l'openai apporte davantage de modèles d'IA de premier plan tout en réduisant le coût d'utilisation pour les utilisateurs.

Du point de vue de l'expérience personnelle d'un blogueur utilisant R1, je voudrais dire que la pensée profonde de R1 m'ouvre toujours l'esprit. Je recommande à tout le monde de l'utiliser davantage pour réfléchir aux problèmes~~.

Non classé

Qu'est-ce que FlashMLA ? Un guide complet sur son impact sur les noyaux de décodage de l'IA

Pardeepseeker 24 février 202524 février 2025

FlashMLA a rapidement attiré l’attention dans le monde de l’intelligence artificielle, notamment dans le domaine des grands modèles de langage (LLM). Cet outil innovant, développé par DeepSeek, sert de noyau de décodage optimisé conçu pour les GPU Hopper, des puces hautes performances couramment utilisées dans les calculs d’IA. FlashMLA se concentre sur le traitement efficace de séquences de longueur variable, ce qui le rend particulièrement bien adapté…

Non classé

Les principaux produits d'IA du monde se concentrent sur l'analyse et les directives complètes en matière d'expérience utilisateur (y compris DeepSeek et GPT)

Parzddeepseeker 10 février 202510 février 2025

Analyse des avantages de base et positionnement des fonctions ChatGPT (OpenAI) – la référence mondiale pour les polyvalents ChatGPT Gènes techniques : IA générative basée sur la série GPT de grands modèles, avec des compétences conversationnelles générales et un raisonnement logique comme principaux avantages. Traitement multilingue : fonctionne mieux en anglais, avec une amélioration continue en chinois ; mais nous recommandons d'utiliser l'anglais pour…

Non classé

DeepSeek l'a fait ! OpenAI admet avoir commis une erreur en matière de sources fermées, l'avantage de la technologie de pointe s'amenuise

Parzddeepseeker 2 février 20252 février 2025

Après la sortie du modèle o3-mini d'OpenAI, son PDG Sam Altman, son directeur de la recherche Mark Chen, son directeur des produits Kevin Weil, le vice-président de l'ingénierie Srinivas Narayanan, la responsable de la recherche sur les API Michelle Pokrass et la responsable de la recherche Hongyu Ren ont mené une séance de questions-réponses techniques en ligne sur reddit, l'un des plus grands forums de discussion au monde. Les principaux sujets...

Non classé

Interprétation du document DeepSeek R1 et points techniques clés

Parzddeepseeker 9 février 20259 février 2025

1 Contexte Au cours du Festival du Printemps, DeepSeek R1 a de nouveau attiré l'attention, et même l'article d'interprétation de DeepSeek V3 que nous avons écrit précédemment a également été retransmis et beaucoup discuté. Bien qu'il y ait eu de nombreuses analyses et reproductions de DeepSeek R1, nous avons décidé ici de compiler quelques notes de lecture correspondantes. Nous utiliserons trois…

Non classé

Le secret derrière DeepSeek 1 | DeepSeekMath et les détails du GRPO

Parzddeepseeker 9 février 20259 février 2025

Aujourd'hui, j'aimerais partager un article de DeepSeek, intitulé DeepSeekMath : repousser les limites du raisonnement mathématique dans les modèles de langage ouvert. Cet article présente DeepSeekMath 7B, qui est pré-entraîné sur DeepSeek-Coder-Base-v1.5 7B basé sur une collection de 120 B de jetons liés aux mathématiques, de langage naturel et de données de code. Le modèle a obtenu un score étonnant de 51,71 TP11T au niveau compétitif…

Non classé

DeepSeek R1 est arrivé premier au test d'écriture créative, et o3 mini était encore pire que o1 mini !

Parzddeepseeker 3 février 20253 février 2025

DeepSeek R1 a remporté le championnat du test de référence pour l'écriture créative de nouvelles, en dépassant le précédent joueur dominant, Claude 3.5 Sonnet ! Test de référence Le test de référence conçu par le chercheur Lech Mazur n'est pas un concours d'écriture ordinaire. Chaque modèle d'IA devait écrire 500 nouvelles, et chacune d'entre elles devait intégrer intelligemment...

Points forts

Comparer

Prix

Résumé

A lire également

Laisser un commentaire Annuler la réponse