zddeepseeker - Deepseek R1

Nelja parima mudeli võrdlus! Ülevaade Deepseek R1 võimast võimekusest

Autorzddeepseeker 1. juuni 20251. juuni 2025

Viimaste päevade jooksul on Deepseek-R1 0528 ametlikult avatud lähtekoodiga. LiveCodeBenchis on selle jõudlus peaaegu võrdne OpenAI o3-ga (kõrge); Aideri mitmekeelses võrdlustestis hoiab see end Claude Opuse moodil. Kui see ametlikul veebisaidil avaldati, testisime kiiresti selle esiotsa võimalusi ja leidsime, et need on erakordselt...

Mittekategoriseeritud

DeepSeek-R1-0528 uuendus: sügavam mõtlemine, tugevam arutluskäik

Autorzddeepseeker 29. mai 202529. mai 2025

DeepSeek R1 mudel on läbinud väikese versiooniuuenduse, praegune versioon on DeepSeek-R1-0528. DeepSeek veebilehele või rakendusse sisenedes lubage dialoogiboksis funktsioon „Deep Thinking“, et kogeda uusimat versiooni. DeepSeek-R1-0528 mudeli kaalud on üles laaditud HuggingFace'i. Viimase nelja kuu jooksul on DeepSeek-R1 läbinud…

Mittekategoriseeritud

DeepSeek on välja andnud oma lähtekoodi, FlashMLA üksikasjaliku selgituse

Autorzddeepseeker 24. veebruar 202524. veebruar 2025

Eelmisel nädalal teatas DeepSeek, et avab järgmisel nädalal viis projekti: Netizens ütles: "Seekord on OpenAI tõesti siin." Just nüüd tuli esimene avatud lähtekoodiga projekt, mis on seotud järelduste kiirendamisega, FlashMLA: avatud lähtekoodiga projekti aadress: DeepSeek FlashMLA See on olnud avatud lähtekoodiga kaks tundi ja Githubil on juba 2,7 000 tärni: The…

Mittekategoriseeritud

Qwen2.5-max vs DeepSeek R1: mudelite põhjalik võrdlus: rakendusstsenaariumide täielik analüüs

Autorzddeepseeker 14. veebruar 202514. veebruar 2025

Sissejuhatus Tänapäeval on suurtel keelemudelitel (LLM) oluline roll. 2025. aasta alguses, kui konkurents tehisintellekti pärast teravnes, tõi Alibaba turule uue Qwen2.5-max AI mudeli ja Hiina Hangzhou ettevõte DeepSeek tõi turule mudeli R1, mis esindab LLM-tehnoloogia tippu. Deepseek R1 on avatud lähtekoodiga AI mudel, mis on meelitanud…

Mittekategoriseeritud

See on DeepSeek-R1-32B lähedal ja purustab Fei-Fei Li s1! UC Berkeley ja muud avatud lähtekoodiga uued SOTA järeldusmudelid

Autorzddeepseeker 14. veebruar 202514. veebruar 2025

32B järeldusmudel kasutab ainult 1/8 andmetest ja on seotud sama suurusega DeepSeek-R1-ga! Just praegu on sellised asutused nagu Stanford, UC Berkeley ja Washingtoni ülikool ühiselt välja andnud SOTA-taseme järeldusmudeli OpenThinker-32B ja on ka avatud lähtekoodiga kuni 114 000 koolitusandmeid. OpenThinker Projecti koduleht: OpenThinkeri kallistav nägu:…

Mittekategoriseeritud

Suured keelemudelite haldusartefaktid, nagu DeepSeek: Cherry Studio, Chatbox, AnythingLLM, kes on teie tõhususe kiirendaja?

Autorzddeepseeker 11. veebruar 202511. veebruar 2025

Paljud inimesed on juba alustanud Deepseek Large Language Models'i kohapeal juurutamist ja kasutamist, kasutades Chatboxi visualiseerimistööriistana. See artikkel jätkab kahe teise AI suure keelemudeli haldus- ja visualiseerimisartefakti tutvustamist ning võrdleb neid kolme üksikasjalikult, et aidata teil AI suuri keelemudeleid tõhusamalt kasutada. Aastal 2025,…

Mittekategoriseeritud

Saja miljardi dollari suuruse investeeringuga on edetabelite esikohal Le Chat. Kas see on USA ja Hiina järel kolmas tehisintellekti jõud?

Autorzddeepseeker 11. veebruar 202511. veebruar 2025

9. veebruaril teatas Prantsusmaa president Emmanuel Macron, et Prantsusmaa investeerib lähiaastatel tehisintellekti valdkonda 109 miljardit eurot (113 miljardit USA dollarit). Seda investeeringut kasutatakse Prantsusmaal tehisintellekti pargi rajamiseks, infrastruktuuri parandamiseks ja kohalikesse idufirmadesse investeerimiseks. Samal ajal Mistral, Prantsusmaa idufirma,…

Mittekategoriseeritud

Mida suudab Deepseek saavutada? Isegi OpenAI ei saa sellega hakkama?

Autorzddeepseeker 10. veebruar 202510. veebruar 2025

DeepSeek tegelik väärtus on alahinnatud! DeepSeek-R1 on kahtlemata toonud turule uue entusiasmi laine. Mitte ainult asjakohased nn kasusaajate eesmärgid ei tõuse järsult, vaid mõned inimesed on isegi arendanud DeepSeek-ga seotud kursusi ja tarkvara, et sellega raha teenida. Usume, et kuigi neil nähtustel on…

Mittekategoriseeritud

Maailma peamised AI-tooted keskenduvad analüüsile ja põhjalikele kasutajakogemuse juhistele (sh DeepSeek ja GPT)

Autorzddeepseeker 10. veebruar 202510. veebruar 2025

Funktsioonide positsioneerimine ja peamiste eeliste analüüs ChatGPT (OpenAI) – universaalne etalon ChatGPT Tehnilised geenid: generatiivne AI, mis põhineb suurte mudelite GPT seerial, mille põhieelisteks on üldised vestlusoskused ja loogiline arutluskäik. Mitmekeelne töötlemine: toimib kõige paremini inglise keeles, pidevalt täiustades hiina keelt, kuid soovitame kasutada inglise keelt, et…

Mittekategoriseeritud

DeepSeek 1 saladus | DeepSeekMath ja GRPO üksikasjad

Autorzddeepseeker 9. veebruar 20259. veebruar 2025

Täna tahaksin jagada DeepSeek artiklit pealkirjaga DeepSeekMath: Matemaatilise arutluse piiride lükkamine avatud keelemudelites. Selles artiklis tutvustatakse versiooni DeepSeekMath 7B, mis on eelkoolitatud versioonil DeepSeek-Coder-Base-v1.5 7B, mis põhineb 120B matemaatikaga seotud žetoonide, loomuliku keele ja koodi andmetel. Mudel saavutas konkurentsitasemel hämmastava skoori 51,7%…