OpenAI a publié son dernier modèle d'inférence, o3-miniqui est optimisé pour des domaines tels que les sciences, les mathématiques et la programmation, offrant une réponse plus rapide, une plus grande précision et un coût moins élevé.
Par rapport à son prédécesseur o1-mini, o3-mini a considérablement amélioré ses capacités d'inférence, en particulier pour la résolution de problèmes complexes. Les testeurs préfèrent les réponses de o3-mini de 56%, et le taux d'erreur a été réduit de 39%. À partir d'aujourd'hui, ChatGPT Plus, équipe et Pro peuvent utiliser o3-mini, et utilisateurs gratuits peut également expérimenter certaines de ses fonctionnalités.

Par rapport au modèle d'inférence DeepSeek-R1La qualité de l'eau est donc bien meilleure que celle de l'eau de mer. OpenAI o3-mini que la R1 ?
Cet article donnera d'abord un aperçu des points forts de o3-mini, puis nous extrairons les données des deux côtés sur chaque point de référence et nous ferons un graphique pour les comparer visuellement. En outre, nous comparerons également le prix de o3-mini.
Points forts
1.Optimisation des STIM: il excelle dans les domaines des mathématiques, de la programmation, de la science, etc., et surpasse en particulier o1-mini dans le mode d'effort d'inférence élevé.
2.Fonctions du développeurLe système de gestion de l'information (SGI) : prend en charge des fonctions telles que les appels de fonction, les sorties structurées et les messages de développeur pour répondre aux besoins de l'environnement de production.
3.Réponse rapideLe temps de réponse de 24% est plus rapide que celui de o1-mini, avec un temps de réponse de 7,7 secondes par requête.
4.Amélioration de la sécurité: garantit une production sûre et fiable grâce à une technologie d'alignement en profondeur.
5.RentabilitéLes capacités d'inférence et l'optimisation des coûts vont de pair, ce qui réduit considérablement le seuil d'utilisation de l'IA.
Comparer
Open AI Afin de mettre en valeur sa classe, son blog officiel ne le compare qu'avec ses propres modèles. Cet article est donc un tableau extrait de l'article DeepSeek R1 et des données du blog officiel d'OpenAI.
OpenAI compare officiellement o3-mini dans la liste des versions, en la divisant en trois versions : faible, moyenne et élevée, qui indiquent la force de l'inférence. Étant donné que DeepSeek utilise Math-500 et qu'OpenAI utilise l'ensemble de données Math, cette comparaison a été supprimée ici.

Un graphique est plus intuitif, et Codeforces a été supprimé parce que les valeurs sont trop grandes pour être affichées de manière intuitive. Toutefois, la comparaison sur Codeforces montre que la force d'inférence élevée d'o3-mini n'est pas très importante.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Vérifié
D'après le graphique, il y a au total 4 comparaisons, et l'O3-mini (haut) est généralement en tête, mais l'avance est très faible.
Prix
modèle | Prix des intrants | Cache hit | Prix à la production |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
Résumé
Le DeepSeek R1 ayant déclenché la panique du DeepSeek aux États-Unis, OpenAI a été la première à se sentir menacée, ce qui est particulièrement évident dans la tarification de son nouveau modèle o3-mini.
Lors de la sortie d'Openai o1, son prix élevé a mis la pression sur de nombreux développeurs et utilisateurs. L'apparition de DeepSeek R1 a donné plus de choix à chacun.De la différence de prix de 30 fois entre o1 et R1 au prix final de o3-mini qui est deux fois plus élevé que celui de o3-mini. le prix de DeepSeek R1,
montre l'impact de DeepSeek R1 sur openai.Cependant, les utilisateurs gratuits de ChatGPT ne peuvent expérimenter o3-mini que de manière limitée, tandis que la fonction Deep Thinking de DeepSeek est actuellement disponible pour tous les utilisateurs.Je me réjouis également que l'openai apporte davantage de modèles d'IA de premier plan tout en réduisant le coût d'utilisation pour les utilisateurs.
Du point de vue de l'expérience personnelle d'un blogueur utilisant R1, je voudrais dire que la pensée profonde de R1 m'ouvre toujours l'esprit. Je recommande à tout le monde de l'utiliser davantage pour réfléchir aux problèmes~~.