Een uitgebreide vergelijking van OpenAI's onlangs uitgebrachte o3-mini en DeepSeek R1

OpenAI heeft zijn nieuwste inferentiemodel uitgebracht, o3-minidie geoptimaliseerd is voor vakgebieden als wetenschap, wiskunde en programmeren en snellere reacties, hogere nauwkeurigheid en lagere kosten biedt.

Vergeleken met zijn voorganger o1-mini heeft o3-mini zijn inferentiemogelijkheden aanzienlijk verbeterd, vooral bij het oplossen van complexe problemen. Testers geven de voorkeur aan de antwoorden van o3-mini met 56% en het foutenpercentage is verminderd met 39%. Vanaf vandaag, ChatGPT Plus, Team en Pro gebruikers kunnen o3-mini gebruiken en gratis gebruikers kan ook enkele van de functies ervaren.

Vergeleken met het inferentiemodel DeepSeek-R1hoeveel beter is OpenAI o3-mini dan R1?

In dit artikel geven we eerst een overzicht van de belangrijkste kenmerken van o3-mini. Daarna extraheren we de gegevens van beide zijden van elke benchmark en maken we een grafiek om ze visueel te vergelijken. Daarnaast vergelijken we ook de prijs van o3-mini.

Inhoudsopgave

Belangrijkste punten

1.STEM optimalisatieblinkt uit op het gebied van wiskunde, programmeren, wetenschap, enz. en overtreft met name o1-mini in de modus voor hoge inferentie-inspanning.

2.Functies voor ontwikkelaars: ondersteunt functies zoals functieaanroepen, gestructureerde uitvoer en ontwikkelaarsberichten om te voldoen aan de behoeften van de productieomgeving.

3.Snelle reactie24% sneller dan o1-mini, met een responstijd van 7,7 seconden per aanvraag.

4.Verbetering van de beveiliging: zorgt voor een veilige en betrouwbare uitvoer dankzij de deep alignment technologie.

5.Kosteneffectief: inferentiemogelijkheden en kostenoptimalisatie gaan hand in hand, waardoor de drempel voor het gebruik van AI sterk wordt verlaagd.

Vergelijk

Open AI Om zijn klasse te benadrukken, is zijn officiële blog vergelijkt het alleen met zijn eigen modellen. Daarom is dit artikel een tabel uit de DeepSeek R1 paper en de gegevens van de officiële OpenAI blog.

OpenAI vergelijkt officieel o3-mini in de versielijst, onderverdeeld in drie versies: laag, medium en hoog, die de inferentiesterkte aangeven. Omdat DeepSeek Math-500 gebruikt en OpenAI de Math-dataset, is deze vergelijking hier verwijderd.

Een grafiek is intuïtiever en Codeforces is verwijderd omdat de waarden te groot zijn om intuïtief te worden weergegeven. De vergelijking op Codeforces laat echter zien dat de hoge inferentiesterkte van o3-mini niet veel voorsprong heeft.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-gecontroleerd

Uit de grafiek blijkt dat er in totaal 4 vergelijkingen zijn en de O3-mini (hoog) leidt over het algemeen, maar de voorsprong is erg klein.

Prijs

model	Invoerprijs	Cache hit	Uitvoerprijs
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Diepzoeker R1	$0.55	$0.14	$2.19

Samenvatting

Nu DeepSeek R1 in de Verenigde Staten de DeepSeek-paniek heeft veroorzaakt, was OpenAI de eerste die zich bedreigd voelde, wat vooral blijkt uit de prijsstelling van zijn nieuwe model o3-mini.

Toen Openai o1 voor het eerst werd uitgebracht, zette de hoge prijs veel ontwikkelaars en gebruikers onder druk. Het verschijnen van DeepSeek R1 gaf iedereen meer keuzes.Van het 30-voudige prijsverschil tussen o1 en R1 tot de uiteindelijke prijs van o3-mini die twee keer zo hoog is de prijs van DeepSeek R1,

toont de invloed van DeepSeek R1 op openai.Gratis gebruikers van ChatGPT kunnen o3-mini echter slechts beperkt ervaren, terwijl Deep Thinking van DeepSeek momenteel beschikbaar is voor alle gebruikers.Ik kijk er ook naar uit dat openai meer toonaangevende ai modellen brengt en tegelijkertijd de gebruikskosten voor gebruikers verlaagt.

Vanuit het perspectief van de persoonlijke ervaring van een blogger die R1 gebruikt, wil ik zeggen dat het Diep Denken van R1 mijn geest altijd opent. Ik raad iedereen aan het meer te gebruiken om na te denken over problemen~

Uncategorized

DeepSeek heeft het gedaan! OpenAI geeft closed source fout toe, voorsprong wordt kleiner

Doorzddeepseeker 2 februari 20252 februari 2025

Nadat OpenAI het o3-mini model had uitgebracht, hielden de CEO Sam Altman, Chief Research Officer Mark Chen, Chief Product Officer Kevin Weil; Vice President of Engineering Srinivas Narayanan, Head of API Research Michelle Pokrass, en Head of Research Hongyu Ren, een online technisch vraaggesprek op reddit, een van 's werelds grootste uitgebreide forums. De belangrijkste onderwerpen...

Uncategorized

Het ligt dicht bij DeepSeek-R1-32B en verplettert Fei-Fei Li's s1! UC Berkeley en andere open source nieuwe SOTA-inferentiemodellen

Doorzddeepseeker 14 februari 202514 februari 2025

Het 32B-inferentiemodel gebruikt slechts 1/8 van de data en is gelijk aan DeepSeek-R1 van dezelfde grootte! Zojuist hebben instituten als Stanford, UC Berkeley en de University of Washington gezamenlijk een SOTA-niveau-inferentiemodel uitgebracht, OpenThinker-32B, en hebben ze ook tot 114k trainingsdata open source gemaakt. OpenThinker Project homepage: OpenThinker Hugging Face:…

Uncategorized

Grote artefacten voor het beheer van taalmodellen zoals DeepSeek: Cherry Studio, Chatbox, AnythingLLM, wie is uw efficiëntieversneller?

Doorzddeepseeker 11 februari 202511 februari 2025

Veel mensen zijn al begonnen met het lokaal implementeren en gebruiken van Deepseek Large Language Models, met behulp van Chatbox als visualisatietool. Dit artikel zal twee andere AI Large Language Model-beheer- en visualisatieartefacten blijven introduceren, en zal de drie in detail vergelijken om u te helpen AI Large Language Models efficiënter te gebruiken. In 2025,…

Uncategorized

Qwen2.5-max vs DeepSeek R1: een diepgaande vergelijking van modellen: een volledige analyse van toepassingsscenario's

Doorzddeepseeker 14 februari 202514 februari 2025

Inleiding Tegenwoordig spelen grote taalmodellen (LLM's) een cruciale rol. Begin 2025, toen de concurrentie voor AI toenam, lanceerde Alibaba het nieuwe Qwen2.5-max AI-model en DeepSeek, een bedrijf uit Hangzhou, China, lanceerde het R1-model, dat het hoogtepunt van LLM-technologie vertegenwoordigt. Deepseek R1 is een open source AI-model dat…

Uncategorized

Le Chat staat bovenaan de lijst, met een investering van honderd miljard dollar. Is het na de VS en China de derde AI-macht?

Doorzddeepseeker 11 februari 202511 februari 2025

Op 9 februari kondigde de Franse president Emmanuel Macron aan dat Frankrijk de komende jaren 109 miljard euro (113 miljard Amerikaanse dollars) zou investeren in het veld van AI. Deze investering zal worden gebruikt om een AI-park in Frankrijk te bouwen, de infrastructuur te verbeteren en te investeren in lokale AI-startups. Ondertussen heeft Mistral, een Franse startup,…

Uncategorized

a16z-dialoog met 27-jarige CEO: AI Agent heeft een enorm hefboomeffect en de prijzen op lange termijn zullen gekoppeld zijn aan de arbeidskosten

Doorzddeepseeker 8 februari 20258 februari 2025

Hoogtepunten AI Agent verandert de klantervaring Jesse Zhang: Hoe wordt een Agent eigenlijk opgebouwd? Wij zijn van mening dat het na verloop van tijd steeds meer op een natuurlijke taalgebaseerde Agent zal lijken, omdat de grote taalmodellen (LLM's) op die manier worden getraind. Op de lange termijn, als je een superintelligente agent hebt die...

Belangrijkste punten

Vergelijk

Prijs

Samenvatting

Vergelijkbare berichten

Geef een reactie Reactie annuleren