zddeepseeker - Deepseek R1 - Side 2 af 3

Ikke kategoriseret

DeepSeek-R1 teknologi afsløret: kerneprincipperne i papiret er nedbrudt, og nøglen til banebrydende modelydelse afsløres

Afzddeepseeker 9. februar 20259. februar 2025

I dag vil vi dele DeepSeek R1, Titel: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM via reinforcement learning. Dette papir introducerer DeepSeeks første generation af ræsonnement-modeller, DeepSeek-R1-Zero og DeepSeek-R1. DeepSeek-R1-Zero-modellen blev trænet gennem storstilet forstærkningslæring (RL) uden overvåget finjustering (SFT) som et indledende trin,...

Ikke kategoriseret

DeepSeek R1 papirfortolkning og vigtige tekniske punkter

Afzddeepseeker 9. februar 20259. februar 2025

1 Baggrund Under forårsfestivalen vakte DeepSeek R1 igen stor opmærksomhed, og selv den DeepSeek V3-fortolkningsartikel, vi tidligere skrev, blev også gentransmitteret og diskuteret en del. Selvom der har været mange analyser og gengivelser af DeepSeek R1, har vi her besluttet at samle nogle tilsvarende læsenoter. Vi vil bruge tre...

Googles lavprismodel, Gemini 2.0-serien, angriber: Kampen om omkostningseffektivitet i store modeller intensiveres

Ikke kategoriseret

Googles lavprismodel, Gemini 2.0-serien, angriber: Kampen om omkostningseffektivitet i store modeller intensiveres

Afzddeepseeker 8. februar 20258. februar 2025

De høje omkostninger ved at bruge store AI-modeller er en væsentlig årsag til, at mange AI-applikationer endnu ikke er blevet implementeret og promoveret. At vælge ekstrem ydeevne betyder enorme omkostninger til computerkraft, hvilket fører til høje forbrugsomkostninger, som almindelige brugere ikke kan acceptere. Konkurrencen om store AI-modeller er som en krig uden røg. Efter…

Gemini 2.0 dominerer hitlisterne, mens DeepSeek V3 græder i sin pris, og en ny omkostningseffektiv mester er født!

Ikke kategoriseret

Gemini 2.0 dominerer hitlisterne, mens DeepSeek V3 græder i sin pris, og en ny omkostningseffektiv mester er født!

Afzddeepseeker 8. februar 20258. februar 2025

Google Gemini 2.0-familien er endelig færdig! Den dominerer hitlisterne, så snart den udgives. Midt i jagten på og blokaderne af Deepseek, Qwen og o3 udgav Google tre modeller på én gang tidligt i morges: Gemini 2.0 Pro, Gemini 2.0 Flash og Gemini 2.0 Flash-Lite. På den store model LMSYS-rangliste, Gemini...

a16z dialog med 27-årig administrerende direktør: AI Agent har en enorm løftestangseffekt, og langsigtet prissætning vil være forbundet med lønomkostninger

Ikke kategoriseret

a16z dialog med 27-årig administrerende direktør: AI Agent har en enorm løftestangseffekt, og langsigtet prissætning vil være forbundet med lønomkostninger

Afzddeepseeker 8. februar 20258. februar 2025

Højdepunkter AI Agent omformer kundeoplevelsen Jesse Zhang: Hvordan er en agent egentlig konstrueret? Vores opfattelse er, at det med tiden vil blive mere og mere som en naturlig sprogbaseret Agent, fordi det er sådan, de store sprogmodeller (LLM'er) trænes. På lang sigt, hvis du har en super intelligent agent, der...

Ikke kategoriseret

Cathie Wood: DeepSeek accelererer blot omkostningsreduktionsprocessen; den ekstremt koncentrerede markedsstruktur, der kan sammenlignes med den store depression, vil ændre sig

Afzddeepseeker 8. februar 20258. februar 2025

Højdepunkter Konkurrence med DeepSeek er godt for USA Cathie Wood: Jeg synes, det viser, at omkostningerne ved innovation falder dramatisk, og at denne tendens allerede er startet. For eksempel, før DeepSeek, faldt omkostningerne til træning af kunstig intelligens med 75% om året, og omkostningerne ved inferens faldt endda med 85% til...

Ikke kategoriseret

Google har frigivet tre nye modeller på én gang: Gemini-2.0-Pro er gratis, har en enestående score og rangerer først og er velegnet til kodning og behandling af komplekse prompter!

Afzddeepseeker 8. februar 20258. februar 2025

Historien om Gemini 2.0 accelererer. Flash Thinking Experimental-versionen i december bragte udviklere en fungerende model med lav latenstid og høj ydeevne. Tidligere i år blev 2.0 Flash Thinking Experimental opdateret i Google AI Studio for at forbedre ydeevnen yderligere ved at kombinere Flash-hastigheden med forbedrede inferensegenskaber. I sidste uge…

Ikke kategoriseret

Ali Qwen2.5-Max overhaler DeepSeek-V3! Netizen: Kinas AI lukker hurtigt hullet

Afzddeepseeker 5. februar 20255. februar 2025

Lige nu er endnu en indenlandsk model blevet tilføjet til Big Model Arena-listen fra Ali, Qwen2.5-Max, som overgik DeepSeek-V3 og blev nummer syv i den samlede rangliste med en samlet score på 1332. Den overgik også modeller som Claude 3.5 Sonnet og Llama 3.1 405B i ét fald. Især udmærker den sig i programmering...

Breaking news! DeepSeek-forsker afslører online: R1-træning tog kun to til tre uger, og en kraftig udvikling på R1 nul blev observeret under den kinesiske nytårsferie

Ikke kategoriseret

Breaking news! DeepSeek-forsker afslører online: R1-træning tog kun to til tre uger, og en kraftig udvikling på R1 nul blev observeret under den kinesiske nytårsferie

Afzddeepseeker 4. februar 20254. februar 2025

Breaking news! DeepSeek-forsker afslører online: R1-træning tog kun to til tre uger, og en kraftig udvikling på R1 nul blev observeret under den kinesiske nytårsferie. Lige nu har vi bemærket, at DeepSeek-forsker Daya Guo svarede på netbrugeres spørgsmål om DeepSeek R1 og virksomhedens planer fremadrettet. Vi kan kun sige…

DeepSeek R1 kom først i prøven i kreativ skrivning, og o3 mini var endnu dårligere end o1 mini!

Ikke kategoriseret

DeepSeek R1 kom først i prøven i kreativ skrivning, og o3 mini var endnu dårligere end o1 mini!

Afzddeepseeker 3. februar 20253. februar 2025

DeepSeek R1 vandt mesterskabet i benchmark-testen for kreativ novelleskrivning og overgik dermed den tidligere dominerende spiller Claude 3.5 Sonnet! Benchmark-test Benchmark-testen, der er designet af forskeren Lech Mazur, er ikke en helt almindelig skrivekonkurrence. Hver AI-model skulle færdiggøre 500 noveller, og hver historie skulle på en smart måde inkorporere...