zddeepseeker - Deepseek R1 - Ukurasa wa 2 kati ya 3

Isiyowekwa katika kundi

Teknolojia ya DeepSeek-R1 imefichuliwa: kanuni za msingi za karatasi zimevunjwa na ufunguo wa ufanisi wa utendakazi wa mfano unafichuliwa.

Nazddeepseeker Februari 9, 2025Februari 9, 2025

Leo tutashiriki DeepSeek R1, Kichwa: DeepSeek-R1: Kuhamasisha Uwezo wa Kutoa Sababu katika LLMs kupitia Mafunzo ya Kuimarisha: Kuhamasisha uwezo wa kufikiri wa LLM kupitia mafunzo ya kuimarisha. Karatasi hii inatanguliza kizazi cha kwanza cha DeepSeek cha mifano ya hoja, DeepSeek-R1-Zero na DeepSeek-R1. Muundo wa DeepSeek-R1-Zero ulifunzwa kupitia ujifunzaji wa kiwango kikubwa cha uimarishaji (RL) bila urekebishaji mzuri unaosimamiwa (SFT) kama hatua ya awali,…

Isiyowekwa katika kundi

Ufafanuzi wa karatasi wa DeepSeek R1 & pointi muhimu za kiufundi

Nazddeepseeker Februari 9, 2025Februari 9, 2025

1 Usuli Wakati wa Tamasha la Majira ya Chini, DeepSeek R1 ilivutia watu wengi tena, na hata makala ya tafsiri ya DeepSeek V3 tuliyoandika hapo awali pia ilisambazwa tena na kujadiliwa sana. Ingawa kumekuwa na uchanganuzi na matoleo mengi ya DeepSeek R1, hapa tumeamua kukusanya vidokezo vinavyolingana vya kusoma. Tutatumia tatu…

Mtindo wa bei ya chini wa Google, mfululizo wa Gemini 2.0, unashambulia: vita vya ufanisi wa gharama katika miundo mikubwa vinazidi kuongezeka.

Isiyowekwa katika kundi

Mtindo wa bei ya chini wa Google, mfululizo wa Gemini 2.0, unashambulia: vita vya ufanisi wa gharama katika miundo mikubwa vinazidi kuongezeka.

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Gharama kubwa ya kutumia miundo mikubwa ya AI ni sababu kuu kwa nini programu nyingi za AI bado hazijatekelezwa na kukuzwa. Kuchagua utendakazi uliokithiri kunamaanisha gharama kubwa za nishati ya kompyuta, ambayo husababisha gharama kubwa za matumizi ambazo watumiaji wa kawaida hawawezi kukubali. Ushindani wa aina kubwa za AI ni kama vita bila moshi. Baada ya…

Gemini 2.0 inatawala chati, huku DeepSeek V3 inalia kwa bei yake, na bingwa mpya wa gharama nafuu anazaliwa!

Isiyowekwa katika kundi

Gemini 2.0 inatawala chati, huku DeepSeek V3 inalia kwa bei yake, na bingwa mpya wa gharama nafuu anazaliwa!

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Familia ya Google Gemini 2.0 hatimaye imekamilika! Inatawala chati mara tu inapotolewa. Huku kukiwa na harakati na vizuizi vya Deepseek, Qwen na o3, Google ilitoa miundo mitatu kwa wakati mmoja mapema leo asubuhi: Gemini 2.0 Pro, Gemini 2.0 Flash na Gemini 2.0 Flash-Lite. Kwenye safu kubwa za modeli za LMSYS, Gemini…

mazungumzo ya a16z na Mkurugenzi Mtendaji wa miaka 27: Wakala wa AI ana athari kubwa ya uboreshaji, na bei ya muda mrefu itahusishwa na gharama za wafanyikazi.

Isiyowekwa katika kundi

mazungumzo ya a16z na Mkurugenzi Mtendaji wa miaka 27: Wakala wa AI ana athari kubwa ya uboreshaji, na bei ya muda mrefu itahusishwa na gharama za wafanyikazi.

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Viangazia Wakala wa AI hurekebisha hali ya mteja Jesse Zhang: Je, Wakala huundwaje? Maoni yetu ni kwamba baada ya muda, itakuwa zaidi na zaidi kama Wakala wa lugha asilia kwa sababu ndivyo miundo mikubwa ya lugha (LLMs) inavyofunzwa. Kwa muda mrefu, ikiwa una wakala mwenye akili sana ambaye…

Isiyowekwa katika kundi

Cathie Wood: DeepSeek inaongeza tu mchakato wa kupunguza gharama; muundo wa soko uliokithiri uliokithiri unaolinganishwa na Unyogovu Mkuu utabadilika

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Mashindano ya Muhimu na DeepSeek ni mazuri kwa Marekani Cathie Wood: Nadhani inaonyesha kuwa gharama ya uvumbuzi inashuka sana, na kwamba mtindo huu tayari umeanza. Kwa mfano, kabla ya DeepSeek, gharama ya mafunzo ya akili bandia ilishuka kwa 75% kwa mwaka, na gharama ya makisio ilishuka hata kwa 85% hadi…

Isiyowekwa katika kundi

Google imetoa miundo mitatu mipya kwa wakati mmoja: Gemini-2.0-Pro ni bure, ina alama bora na inashika nafasi ya kwanza, na inafaa kwa usimbaji na usindikaji wa vidokezo tata!

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Hadithi ya Gemini 2.0 inaongezeka kwa kasi. Toleo la Majaribio ya Flash Thinking mnamo Desemba lilileta wasanidi programu muundo wa kufanya kazi wenye utulivu wa chini na utendakazi wa juu. Mapema mwaka huu, Jaribio la 2.0 Flash Thinking lilisasishwa katika Studio ya Google AI ili kuboresha zaidi utendakazi kwa kuchanganya kasi ya Flash na uwezo wa maongezi ulioimarishwa. Wiki iliyopita,…

Isiyowekwa katika kundi

Ali Qwen2.5-Max aipita DeepSeek-V3! Mwanamtandao: AI ya Uchina inaziba pengo kwa haraka

Nazddeepseeker Februari 5, 2025Februari 5, 2025

Hivi sasa, mwanamitindo mwingine wa ndani aliongezwa kwenye orodha ya Big Model Arena kutoka kwa Ali, Qwen2.5-Max, ambayo ilipita DeepSeek-V3 na kushika nafasi ya saba katika viwango vya jumla kwa alama 1332. Pia ilipita wanamitindo kama vile Claude 3.5 Sonnet na Llama 3.1 405B kwa kasi moja. Hasa, inafaulu katika upangaji programu…

Habari zinazochipuka! Mtafiti wa DeepSeek anafichua mtandaoni: Mafunzo ya R1 yalichukua wiki mbili hadi tatu pekee, na mageuzi yenye nguvu ya sifuri ya R1 yalionekana wakati wa likizo ya Mwaka Mpya wa Uchina.

Isiyowekwa katika kundi

Habari zinazochipuka! Mtafiti wa DeepSeek anafichua mtandaoni: Mafunzo ya R1 yalichukua wiki mbili hadi tatu pekee, na mageuzi yenye nguvu ya sifuri ya R1 yalionekana wakati wa likizo ya Mwaka Mpya wa Uchina.

Nazddeepseeker Februari 4, 2025Februari 4, 2025

Habari zinazochipuka! Mtafiti wa DeepSeek anafichua mtandaoni: Mafunzo ya R1 yalichukua wiki mbili hadi tatu pekee, na mabadiliko makubwa ya sifuri ya R1 yalionekana wakati wa likizo ya Mwaka Mpya wa Uchina Hivi sasa, tuligundua kuwa mtafiti wa DeepSeek Daya Guo alijibu maswali ya wanamtandao kuhusu DeepSeek R1 na mipango ya kampuni. kwenda mbele. Tunaweza kusema tu…

DeepSeek R1 ilikuja kwanza katika jaribio la uandishi wa ubunifu, na o3 mini ilikuwa mbaya zaidi kuliko o1 mini!

Isiyowekwa katika kundi

DeepSeek R1 ilikuja kwanza katika jaribio la uandishi wa ubunifu, na o3 mini ilikuwa mbaya zaidi kuliko o1 mini!

Nazddeepseeker Februari 3, 2025Februari 3, 2025

DeepSeek R1 ilishinda ubingwa katika jaribio la kuigwa la uandishi wa hadithi fupi za ubunifu, na kumpita kwa mafanikio mchezaji mkuu wa awali Claude 3.5 Sonnet! Mtihani wa kuigwa Jaribio la kuigwa lililoundwa na mtafiti Lech Mazur si shindano lako la wastani la uandishi. Kila modeli ya AI ilihitajika kukamilisha hadithi fupi 500, na kila hadithi ilibidi ijumuishe kwa ustadi…