zddeepseeker - Deepseek R1

Opgøret mellem de fire bedste modeller! En anmeldelse viser, hvor kraftfuld Deepseek R1 er

Afzddeepseeker 1. juni 20251. juni 2025

I løbet af de seneste par dage er Deepseek-R1 0528 officielt blevet open source. På LiveCodeBench er dens ydeevne næsten på niveau med OpenAIs o3 (høj); i Aiders flersprogede benchmarktest kan den måle sig med Claude Opus. Da den blev lanceret på den officielle hjemmeside, testede vi hurtigt dens frontend-funktioner og fandt dem exceptionelt ...

Ikke kategoriseret

DeepSeek-R1-0528 Opdatering: Dybere tænkning, stærkere ræsonnement

Afzddeepseeker 29. maj 202529. maj 2025

DeepSeek R1-modellen har gennemgået en mindre versionsopgradering, hvor den nuværende version er DeepSeek-R1-0528. Når du åbner DeepSeek-websiden eller -appen, skal du aktivere funktionen "Deep Thinking" i dialoggrænsefladen for at opleve den nyeste version. DeepSeek-R1-0528-modelvægtene er blevet uploadet til HuggingFace. I løbet af de sidste fire måneder har DeepSeek-R1 gennemgået...

Ikke kategoriseret

DeepSeek har frigivet sin kildekode, detaljeret forklaring af FlashMLA

Afzddeepseeker 24. februar 202524. februar 2025

I sidste uge annoncerede DeepSeek, at det ville open source fem projekter i næste uge: Netizens sagde: "Denne gang er OpenAI virkelig her." Lige nu kom det første open source-projekt, relateret til inferensacceleration, FlashMLA: Open source-projektadresse: DeepSeek FlashMLA Det har været open source i to timer, og Github har allerede 2,7k+ stjerner: The...

Ikke kategoriseret

Qwen2.5-max vs DeepSeek R1: En dyb sammenligning af modeller: en komplet analyse af applikationsscenarier

Afzddeepseeker 14. februar 202514. februar 2025

Introduktion I dag spiller store sprogmodeller (LLM'er) en afgørende rolle. I begyndelsen af 2025, da konkurrencen om AI blev intensiveret, lancerede Alibaba den nye Qwen2.5-max AI-model, og DeepSeek, et firma fra Hangzhou, Kina, lancerede R1-modellen, som repræsenterer toppen af LLM-teknologien. Deepseek R1 er en open source AI-model, der har tiltrukket...

Ikke kategoriseret

Det er tæt på DeepSeek-R1-32B og knuser Fei-Fei Lis s1! UC Berkeley og andre open source nye SOTA-inferensmodeller

Afzddeepseeker 14. februar 202514. februar 2025

32B-inferensmodellen bruger kun 1/8 af dataene og er bundet med DeepSeek-R1 af samme størrelse! Netop nu har institutioner som Stanford, UC Berkeley og University of Washington i fællesskab frigivet en inferensmodel på SOTA-niveau, OpenThinker-32B, og har også open source op til 114.000 træningsdata. OpenThinker Projects hjemmeside: OpenThinker Hugging Face:...

Ikke kategoriseret

Store sprogmodelstyringsartefakter såsom DeepSeek: Cherry Studio, Chatbox, AnythingLLM, hvem er din effektivitetsaccelerator?

Afzddeepseeker 11. februar 202511. februar 2025

Mange mennesker er allerede begyndt at implementere og bruge Deepseek Large Language Models lokalt ved at bruge Chatbox som et visualiseringsværktøj. Denne artikel vil fortsætte med at introducere to andre AI Large Language Model management og visualiseringsartefakter, og vil sammenligne de tre i detaljer for at hjælpe dig med at bruge AI Large Language Models mere effektivt. I 2025,…

Ikke kategoriseret

Le Chat topper hitlisterne med en investering på hundrede milliarder dollars. Efter USA og Kina, er det den tredje AI-magt?

Afzddeepseeker 11. februar 202511. februar 2025

Den 9. februar meddelte den franske præsident Emmanuel Macron, at Frankrig ville investere 109 milliarder euro (113 milliarder amerikanske dollars) inden for kunstig intelligens i de næste par år. Denne investering vil blive brugt til at bygge en AI-park i Frankrig, forbedre infrastrukturen og investere i lokale AI-start-ups. I mellemtiden har Mistral, en fransk startup,...

Ikke kategoriseret

Hvad kan Deepseek opnå? Selv OpenAI kan ikke gøre det?

Afzddeepseeker 10. februar 202510. februar 2025

Den sande værdi af DeepSeek er undervurderet! DeepSeek-R1 har uden tvivl bragt en ny bølge af entusiasme til markedet. Ikke alene stiger de relevante såkaldte modtagermål kraftigt, men nogle mennesker har endda udviklet DeepSeek-relaterede kurser og software i et forsøg på at tjene penge på det. Vi mener, at selvom disse fænomener har en...

Ikke kategoriseret

Verdens mainstream AI-produkter fokuserer på analyse og omfattende retningslinjer for brugeroplevelse (inklusive DeepSeek og GPT)

Afzddeepseeker 10. februar 202510. februar 2025

Funktionspositionering og kernefordelsanalyse ChatGPT (OpenAI) – det globale benchmark for alle-rounders ChatGPT Tekniske gener: generativ AI baseret på GPT-serien af store modeller, med generelle samtaleevner og logisk ræsonnement som sine kernefordele. Flersproget behandling: fungerer bedst på engelsk, med løbende forbedringer på kinesisk; men vi anbefaler at bruge engelsk til...

Ikke kategoriseret

Hemmeligheden bag DeepSeek 1 | DeepSeekMath og GRPO detaljer

Afzddeepseeker 9. februar 20259. februar 2025

I dag vil jeg gerne dele en artikel fra DeepSeek med titlen DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Denne artikel introducerer DeepSeekMath 7B, som er fortrænet på DeepSeek-Coder-Base-v1.5 7B baseret på en samling af 120B matematik-relaterede tokens, naturligt sprog og kodedata. Modellen opnåede en forbløffende score på 51.7% på konkurrenceniveau...