zddeepseeker - Deepseek R1

Die konfrontasie van die top vier modelle! 'n Oorsig wys hoe kragtig Deepseek R1 is

Deurzddeepseeker 1 Junie 20251 Junie 2025

Oor die afgelope paar dae is Deepseek-R1 0528 amptelik oopbron beskikbaar gestel. Op LiveCodeBench is die werkverrigting daarvan amper gelykstaande aan OpenAI se o3 (hoog); in Aider se veeltalige maatstaftoets staan dit sy eie teen Claude Opus. Toe dit op die amptelike webwerf bekendgestel is, het ons vinnig die voorkantvermoëns daarvan getoets en gevind dat dit buitengewoon is...

Ongekategoriseer

DeepSeek-R1-0528 Opdatering: Dieper denke, sterker redenasie

Deurzddeepseeker 29 Mei 202529 Mei 2025

Die DeepSeek R1-model het 'n klein weergawe-opgradering ondergaan, met die huidige weergawe DeepSeek-R1-0528. Wanneer jy die DeepSeek-webwerf of -toepassing besoek, aktiveer die "Diep denke"-funksie in die dialoogkoppelvlak om die nuutste weergawe te ervaar. Die DeepSeek-R1-0528-modelgewigte is na HuggingFace opgelaai. Oor die afgelope vier maande het DeepSeek-R1...

Ongekategoriseer

DeepSeek het sy bronkode vrygestel, gedetailleerde verduideliking van FlashMLA

Deurzddeepseeker 24 Februarie 202524 Februarie 2025

Verlede week het DeepSeek aangekondig dat hy volgende week vyf projekte sal oopmaak: Netizens het gesê: "Hierdie keer is OpenAI regtig hier." Netnou het die eerste oopbronprojek gekom, wat verband hou met afleidingversnelling, FlashMLA: Oopbronprojekadres: DeepSeek FlashMLA Dit is al twee uur lank oopbron, en Github het reeds 2.7k+ sterre: Die ...

Ongekategoriseer

Qwen2.5-max vs DeepSeek R1: 'n Diep vergelyking van modelle: 'n volledige ontleding van toepassingscenario's

Deurzddeepseeker 14 Februarie 202514 Februarie 2025

Inleiding Vandag speel groot taalmodelle (LLM'e) 'n deurslaggewende rol. Vroeg in 2025, soos die kompetisie vir KI verskerp het, het Alibaba die nuwe Qwen2.5-max KI-model bekendgestel, en DeepSeek, 'n maatskappy van Hangzhou, China, het die R1-model bekendgestel, wat die toppunt van LLM-tegnologie verteenwoordig. Deepseek R1 is 'n oopbron KI-model wat ...

Ongekategoriseer

Dit is naby DeepSeek-R1-32B en verpletter Fei-Fei Li se s1! UC Berkeley en ander oopbron nuwe SOTA-afleidingsmodelle

Deurzddeepseeker 14 Februarie 202514 Februarie 2025

Die 32B-afleidingsmodel gebruik slegs 1/8 van die data en is gekoppel aan DeepSeek-R1 van dieselfde grootte! Sopas het instansies soos Stanford, UC Berkeley en die Universiteit van Washington gesamentlik 'n SOTA-vlak afleidingsmodel, OpenThinker-32B, vrygestel en het ook tot 114k opleidingsdata oopbron verkry. OpenThinker Project-tuisblad: OpenThinker Hugging Face:...

Ongekategoriseer

Groot taalmodelbestuursartefakte soos DeepSeek: Cherry Studio, Chatbox, AnythingLLM, wie is jou doeltreffendheidversneller?

Deurzddeepseeker 11 Februarie 202511 Februarie 2025

Baie mense het reeds begin om Deepseek Large Language Models plaaslik te ontplooi en te gebruik, deur Chatbox as 'n visualiseringsinstrument te gebruik. Hierdie artikel sal voortgaan om twee ander KI Groot Taal Model bestuur en visualisering artefakte bekend te stel, en sal die drie in detail vergelyk om jou te help om KI Groot Taal Modelle meer doeltreffend te gebruik. In 2025,…

Ongekategoriseer

Le Chat is boaan die kaarte, met 'n belegging van honderd miljard dollar. Na die VSA en China, is dit die derde KI-moondheid?

Deurzddeepseeker 11 Februarie 202511 Februarie 2025

Op 9 Februarie het die Franse president Emmanuel Macron aangekondig dat Frankryk in die volgende paar jaar 109 miljard euro (113 miljard Amerikaanse dollars) in die veld van KI sal belê. Hierdie belegging sal gebruik word om 'n KI-park in Frankryk te bou, die infrastruktuur te verbeter en in plaaslike KI-beginners te belê. Intussen het Mistral, 'n Franse begin, ...

Ongekategoriseer

Wat kan Deepseek bereik? Selfs OpenAI kan dit nie doen nie?

Deurzddeepseeker 10 Februarie 202510 Februarie 2025

Die ware waarde van DeepSeek word onderskat! DeepSeek-R1 het ongetwyfeld 'n nuwe golf van entoesiasme na die mark gebring. Nie net styg die betrokke sogenaamde begunstigde-teikens skerp nie, maar sommige mense het selfs DeepSeek-verwante kursusse en sagteware ontwikkel in 'n poging om geld daaruit te maak. Ons glo dat hoewel hierdie verskynsels 'n ...

Ongekategoriseer

Die wêreld se hoofstroom KI-produkte fokus op ontleding en omvattende riglyne vir gebruikerservaring (insluitend DeepSeek en GPT)

Deurzddeepseeker 10 Februarie 202510 Februarie 2025

Funksieposisionering en kernvoordeelontleding ChatGPT (OpenAI) – die globale maatstaf vir alledaagse ChatGPT Tegniese gene: generatiewe KI gebaseer op die GPT-reeks groot modelle, met algemene gespreksvaardighede en logiese redenasie as sy kernvoordele. Veeltalige verwerking: presteer die beste in Engels, met voortdurende verbetering in Chinees; maar ons beveel aan om Engels te gebruik om ...

Ongekategoriseer

Die geheim agter DeepSeek 1 | DeepSeekMath en GRPO besonderhede

Deurzddeepseeker 9 Februarie 20259 Februarie 2025

Vandag wil ek graag 'n artikel van DeepSeek deel, getiteld DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Hierdie artikel stel DeepSeekMath 7B bekend, wat vooraf opgelei is op DeepSeek-Coder-Base-v1.5 7B gebaseer op 'n versameling van 120B wiskundeverwante tekens, natuurlike taal en kodedata. Die model het 'n verstommende telling van 51.7% behaal in mededingende vlak ...