Haijagawanywa - Deepseek R1

Siri ya DeepSeek 1 | DeepSeekMath na maelezo ya GRPO

Isiyowekwa katika kundi

Siri ya DeepSeek 1 | DeepSeekMath na maelezo ya GRPO

Nazddeepseeker Februari 9, 2025Februari 9, 2025

Leo ningependa kushiriki makala kutoka DeepSeek, yenye mada DeepSeekMath: Kusukuma Mipaka ya Kutoa Sababu za Hisabati katika Miundo ya Lugha Huria. Makala haya yanatanguliza DeepSeekMath 7B, ambayo imefunzwa awali kuhusu DeepSeek-Coder-Base-v1.5 7B kulingana na mkusanyiko wa tokeni 120B zinazohusiana na hesabu, lugha asilia na data ya msimbo. Muundo huu ulipata alama ya kushangaza ya 51.7% katika kiwango cha ushindani…

Isiyowekwa katika kundi

Teknolojia ya DeepSeek-R1 imefichuliwa: kanuni za msingi za karatasi zimevunjwa na ufunguo wa ufanisi wa utendakazi wa mfano unafichuliwa.

Nazddeepseeker Februari 9, 2025Februari 9, 2025

Leo tutashiriki DeepSeek R1, Kichwa: DeepSeek-R1: Kuhamasisha Uwezo wa Kutoa Sababu katika LLMs kupitia Mafunzo ya Kuimarisha: Kuhamasisha uwezo wa kufikiri wa LLM kupitia mafunzo ya kuimarisha. Karatasi hii inatanguliza kizazi cha kwanza cha DeepSeek cha mifano ya hoja, DeepSeek-R1-Zero na DeepSeek-R1. Muundo wa DeepSeek-R1-Zero ulifunzwa kupitia ujifunzaji wa kiwango kikubwa cha uimarishaji (RL) bila urekebishaji mzuri unaosimamiwa (SFT) kama hatua ya awali,…

Isiyowekwa katika kundi

Ufafanuzi wa karatasi wa DeepSeek R1 & pointi muhimu za kiufundi

Nazddeepseeker Februari 9, 2025Februari 9, 2025

1 Usuli Wakati wa Tamasha la Majira ya Chini, DeepSeek R1 ilivutia watu wengi tena, na hata makala ya tafsiri ya DeepSeek V3 tuliyoandika hapo awali pia ilisambazwa tena na kujadiliwa sana. Ingawa kumekuwa na uchanganuzi na matoleo mengi ya DeepSeek R1, hapa tumeamua kukusanya vidokezo vinavyolingana vya kusoma. Tutatumia tatu…

Mtindo wa bei ya chini wa Google, mfululizo wa Gemini 2.0, unashambulia: vita vya ufanisi wa gharama katika miundo mikubwa vinazidi kuongezeka.

Isiyowekwa katika kundi

Mtindo wa bei ya chini wa Google, mfululizo wa Gemini 2.0, unashambulia: vita vya ufanisi wa gharama katika miundo mikubwa vinazidi kuongezeka.

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Gharama kubwa ya kutumia miundo mikubwa ya AI ni sababu kuu kwa nini programu nyingi za AI bado hazijatekelezwa na kukuzwa. Kuchagua utendakazi uliokithiri kunamaanisha gharama kubwa za nishati ya kompyuta, ambayo husababisha gharama kubwa za matumizi ambazo watumiaji wa kawaida hawawezi kukubali. Ushindani wa aina kubwa za AI ni kama vita bila moshi. Baada ya…

Gemini 2.0 inatawala chati, huku DeepSeek V3 inalia kwa bei yake, na bingwa mpya wa gharama nafuu anazaliwa!

Isiyowekwa katika kundi

Gemini 2.0 inatawala chati, huku DeepSeek V3 inalia kwa bei yake, na bingwa mpya wa gharama nafuu anazaliwa!

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Familia ya Google Gemini 2.0 hatimaye imekamilika! Inatawala chati mara tu inapotolewa. Huku kukiwa na harakati na vizuizi vya Deepseek, Qwen na o3, Google ilitoa miundo mitatu kwa wakati mmoja mapema leo asubuhi: Gemini 2.0 Pro, Gemini 2.0 Flash na Gemini 2.0 Flash-Lite. Kwenye safu kubwa za modeli za LMSYS, Gemini…

mazungumzo ya a16z na Mkurugenzi Mtendaji wa miaka 27: Wakala wa AI ana athari kubwa ya uboreshaji, na bei ya muda mrefu itahusishwa na gharama za wafanyikazi.

Isiyowekwa katika kundi

mazungumzo ya a16z na Mkurugenzi Mtendaji wa miaka 27: Wakala wa AI ana athari kubwa ya uboreshaji, na bei ya muda mrefu itahusishwa na gharama za wafanyikazi.

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Viangazia Wakala wa AI hurekebisha hali ya mteja Jesse Zhang: Je, Wakala huundwaje? Maoni yetu ni kwamba baada ya muda, itakuwa zaidi na zaidi kama Wakala wa lugha asilia kwa sababu ndivyo miundo mikubwa ya lugha (LLMs) inavyofunzwa. Kwa muda mrefu, ikiwa una wakala mwenye akili sana ambaye…

Isiyowekwa katika kundi

Cathie Wood: DeepSeek inaongeza tu mchakato wa kupunguza gharama; muundo wa soko uliokithiri uliokithiri unaolinganishwa na Unyogovu Mkuu utabadilika

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Mashindano ya Muhimu na DeepSeek ni mazuri kwa Marekani Cathie Wood: Nadhani inaonyesha kuwa gharama ya uvumbuzi inashuka sana, na kwamba mtindo huu tayari umeanza. Kwa mfano, kabla ya DeepSeek, gharama ya mafunzo ya akili bandia ilishuka kwa 75% kwa mwaka, na gharama ya makisio ilishuka hata kwa 85% hadi…

Isiyowekwa katika kundi

Google imetoa miundo mitatu mipya kwa wakati mmoja: Gemini-2.0-Pro ni bure, ina alama bora na inashika nafasi ya kwanza, na inafaa kwa usimbaji na usindikaji wa vidokezo tata!

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Hadithi ya Gemini 2.0 inaongezeka kwa kasi. Toleo la Majaribio ya Flash Thinking mnamo Desemba lilileta wasanidi programu muundo wa kufanya kazi wenye utulivu wa chini na utendakazi wa juu. Mapema mwaka huu, Jaribio la 2.0 Flash Thinking lilisasishwa katika Studio ya Google AI ili kuboresha zaidi utendakazi kwa kuchanganya kasi ya Flash na uwezo wa maongezi ulioimarishwa. Wiki iliyopita,…

DeepSeek TOP17 Mbadala Bora: Uchambuzi wa Kina (2025)

Isiyowekwa katika kundi

DeepSeek TOP17 Mbadala Bora: Uchambuzi wa Kina (2025)

Na1TP7 Ter Februari 6, 2025Februari 6, 2025

Utangulizi Katika mazingira yanayoendelea kukua kwa kasi ya akili bandia, DeepSeek imeibuka kama modeli yenye nguvu ya lugha. Uchanganuzi huu wa kina unachunguza njia mbadala 17 bora za DeepSeek, ukichunguza vipengele vyake vya kipekee, uwezo na matukio ya matumizi. Utafiti wetu unaangazia majukwaa ya kimataifa na ya Kichina ambayo hutoa ujumuishaji wa DeepSeek au uwezo sawa. Uchambuzi Bora Mbadala 1….

Isiyowekwa katika kundi

Ali Qwen2.5-Max aipita DeepSeek-V3! Mwanamtandao: AI ya Uchina inaziba pengo kwa haraka

Nazddeepseeker Februari 5, 2025Februari 5, 2025

Hivi sasa, mwanamitindo mwingine wa ndani aliongezwa kwenye orodha ya Big Model Arena kutoka kwa Ali, Qwen2.5-Max, ambayo ilipita DeepSeek-V3 na kushika nafasi ya saba katika viwango vya jumla kwa alama 1332. Pia ilipita wanamitindo kama vile Claude 3.5 Sonnet na Llama 3.1 405B kwa kasi moja. Hasa, inafaulu katika upangaji programu…