zddeepseeker - Deepseek R1

Uppgörelsen mellan de fyra bästa modellerna! En recension visar hur kraftfull Deepseek R1 är

Avzddeepseeker 1 juni 20251 juni 2025

Under de senaste dagarna har Deepseek-R1 0528 officiellt blivit öppen källkod. På LiveCodeBench är dess prestanda nästan i nivå med OpenAI:s o3 (hög); i Aiders flerspråkiga benchmarktest står den sig mot Claude Opus. När den lanserades på den officiella webbplatsen testade vi snabbt dess frontend-funktioner och fann att de var exceptionellt ...

Okategoriserade

DeepSeek-R1-0528 Uppdatering: Djupare tänkande, starkare resonemang

Avzddeepseeker 29 maj 202529 maj 2025

DeepSeek R1-modellen har genomgått en mindre versionsuppgradering, där den nuvarande versionen är DeepSeek-R1-0528. När du öppnar DeepSeek-webbsidan eller appen, aktivera funktionen "Djuptänkande" i dialoggränssnittet för att uppleva den senaste versionen. DeepSeek-R1-0528-modellens vikter har laddats upp till HuggingFace. Under de senaste fyra månaderna har DeepSeek-R1 genomgått...

Okategoriserade

DeepSeek har släppt sin källkod, detaljerad förklaring av FlashMLA

Avzddeepseeker 24 februari 202524 februari 2025

Förra veckan meddelade DeepSeek att de skulle öppna källkod för fem projekt nästa vecka: Netizens sa: "Den här gången är OpenAI verkligen här." Just nu kom det första open source-projektet, relaterat till inferensacceleration, FlashMLA: Open source-projektadress: DeepSeek FlashMLA Det har varit öppen källkod i två timmar, och Github har redan 2,7k+ stjärnor: The...

Okategoriserade

Qwen2.5-max vs DeepSeek R1: En djupgående jämförelse av modeller: en fullständig analys av tillämpningsscenarier

Avzddeepseeker 14 februari 202514 februari 2025

Inledning Idag spelar stora språkmodeller (LLM) en avgörande roll. I början av 2025, när konkurrensen om AI intensifierades, lanserade Alibaba den nya Qwen2.5-max AI-modellen, och DeepSeek, ett företag från Hangzhou, Kina, lanserade R1-modellen, som representerar toppen av LLM-teknologin. Deepseek R1 är en AI-modell med öppen källkod som har lockat...

Okategoriserade

Den ligger nära DeepSeek-R1-32B och krossar Fei-Fei Lis s1! UC Berkeley och andra nya SOTA-inferensmodeller med öppen källkod

Avzddeepseeker 14 februari 202514 februari 2025

32B inferensmodellen använder bara 1/8 av data och är knuten till DeepSeek-R1 av samma storlek! Just nu har institutioner som Stanford, UC Berkeley och University of Washington tillsammans släppt en slutledningsmodell på SOTA-nivå, OpenThinker-32B, och har även öppnat upp till 114 000 träningsdata med öppen källkod. OpenThinker Projects hemsida: OpenThinker Hugging Face:...

Okategoriserade

Stora språkmodellhanteringsartefakter som DeepSeek: Cherry Studio, Chatbox, AnythingLLM, vem är din effektivitetsaccelerator?

Avzddeepseeker 11 februari 202511 februari 2025

Många människor har redan börjat distribuera och använda Deepseek Large Language Models lokalt, med Chatbox som ett visualiseringsverktyg. Denna artikel kommer att fortsätta att introducera två andra AI Large Language Model Management och visualiseringsartefakter, och kommer att jämföra de tre i detalj för att hjälpa dig att använda AI Large Language Models mer effektivt. År 2025...

Okategoriserade

Le Chat toppar listorna, med en investering på hundra miljarder dollar. Efter USA och Kina, är det den tredje AI-makten?

Avzddeepseeker 11 februari 202511 februari 2025

Den 9 februari meddelade Frankrikes president Emmanuel Macron att Frankrike kommer att investera 109 miljarder euro (113 miljarder US-dollar) inom AI under de närmaste åren. Denna investering kommer att användas för att bygga en AI-park i Frankrike, förbättra infrastrukturen och investera i lokala AI-start-ups. Samtidigt har Mistral, en fransk startup,...

Okategoriserade

Vad kan Deepseek uppnå? Kan inte OpenAI göra det?

Avzddeepseeker 10 februari 202510 februari 2025

Det verkliga värdet av DeepSeek är underskattat! DeepSeek-R1 har utan tvekan fört en ny våg av entusiasm till marknaden. Inte nog med att de relevanta så kallade förmånstagarmålen ökar kraftigt, utan vissa människor har till och med utvecklat DeepSeek-relaterade kurser och mjukvara i ett försök att tjäna pengar på det. Vi tror att även om dessa fenomen har en...

Okategoriserade

Världens vanliga AI-produkter fokuserar på analys och omfattande riktlinjer för användarupplevelsen (inklusive DeepSeek och GPT)

Avzddeepseeker 10 februari 202510 februari 2025

Funktionspositionering och kärnfördelaranalys ChatGPT (OpenAI) – det globala riktmärket för mångsidiga ChatGPT Tekniska gener: generativ AI baserad på GPT-serien av stora modeller, med allmänna konversationsförmåga och logiskt resonemang som sina kärnfördelar. Flerspråkig bearbetning: fungerar bäst på engelska, med ständiga förbättringar på kinesiska; men vi rekommenderar att använda engelska för att...

Okategoriserade

Hemligheten bakom DeepSeek 1 | DeepSeekMath och GRPO detaljer

Avzddeepseeker 9 februari 20259 februari 2025

Idag skulle jag vilja dela en artikel från DeepSeek, med titeln DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Den här artikeln introducerar DeepSeekMath 7B, som är förtränad på DeepSeek-Coder-Base-v1.5 7B baserat på en samling av 120B matematikrelaterade tokens, naturligt språk och koddata. Modellen uppnådde ett häpnadsväckande betyg på 51,7% på konkurrensnivå...