Ikke kategoriseret - Deepseek R1

Hemmeligheden bag DeepSeek 1 | DeepSeekMath og GRPO detaljer

Ikke kategoriseret

Hemmeligheden bag DeepSeek 1 | DeepSeekMath og GRPO detaljer

Afzddeepseeker 9. februar 20259. februar 2025

I dag vil jeg gerne dele en artikel fra DeepSeek med titlen DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Denne artikel introducerer DeepSeekMath 7B, som er fortrænet på DeepSeek-Coder-Base-v1.5 7B baseret på en samling af 120B matematik-relaterede tokens, naturligt sprog og kodedata. Modellen opnåede en forbløffende score på 51.7% på konkurrenceniveau...

Ikke kategoriseret

DeepSeek-R1 teknologi afsløret: kerneprincipperne i papiret er nedbrudt, og nøglen til banebrydende modelydelse afsløres

Afzddeepseeker 9. februar 20259. februar 2025

I dag vil vi dele DeepSeek R1, Titel: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM via reinforcement learning. Dette papir introducerer DeepSeeks første generation af ræsonnement-modeller, DeepSeek-R1-Zero og DeepSeek-R1. DeepSeek-R1-Zero-modellen blev trænet gennem storstilet forstærkningslæring (RL) uden overvåget finjustering (SFT) som et indledende trin,...

Ikke kategoriseret

DeepSeek R1 papirfortolkning og vigtige tekniske punkter

Afzddeepseeker 9. februar 20259. februar 2025

1 Baggrund Under forårsfestivalen vakte DeepSeek R1 igen stor opmærksomhed, og selv den DeepSeek V3-fortolkningsartikel, vi tidligere skrev, blev også gentransmitteret og diskuteret en del. Selvom der har været mange analyser og gengivelser af DeepSeek R1, har vi her besluttet at samle nogle tilsvarende læsenoter. Vi vil bruge tre...

Googles lavprismodel, Gemini 2.0-serien, angriber: Kampen om omkostningseffektivitet i store modeller intensiveres

Ikke kategoriseret

Googles lavprismodel, Gemini 2.0-serien, angriber: Kampen om omkostningseffektivitet i store modeller intensiveres

Afzddeepseeker 8. februar 20258. februar 2025

De høje omkostninger ved at bruge store AI-modeller er en væsentlig årsag til, at mange AI-applikationer endnu ikke er blevet implementeret og promoveret. At vælge ekstrem ydeevne betyder enorme omkostninger til computerkraft, hvilket fører til høje forbrugsomkostninger, som almindelige brugere ikke kan acceptere. Konkurrencen om store AI-modeller er som en krig uden røg. Efter…

Gemini 2.0 dominerer hitlisterne, mens DeepSeek V3 græder i sin pris, og en ny omkostningseffektiv mester er født!

Ikke kategoriseret

Gemini 2.0 dominerer hitlisterne, mens DeepSeek V3 græder i sin pris, og en ny omkostningseffektiv mester er født!

Afzddeepseeker 8. februar 20258. februar 2025

Google Gemini 2.0-familien er endelig færdig! Den dominerer hitlisterne, så snart den udgives. Midt i jagten på og blokaderne af Deepseek, Qwen og o3 udgav Google tre modeller på én gang tidligt i morges: Gemini 2.0 Pro, Gemini 2.0 Flash og Gemini 2.0 Flash-Lite. På den store model LMSYS-rangliste, Gemini...

a16z dialog med 27-årig administrerende direktør: AI Agent har en enorm løftestangseffekt, og langsigtet prissætning vil være forbundet med lønomkostninger

Ikke kategoriseret

a16z dialog med 27-årig administrerende direktør: AI Agent har en enorm løftestangseffekt, og langsigtet prissætning vil være forbundet med lønomkostninger

Afzddeepseeker 8. februar 20258. februar 2025

Højdepunkter AI Agent omformer kundeoplevelsen Jesse Zhang: Hvordan er en agent egentlig konstrueret? Vores opfattelse er, at det med tiden vil blive mere og mere som en naturlig sprogbaseret Agent, fordi det er sådan, de store sprogmodeller (LLM'er) trænes. På lang sigt, hvis du har en super intelligent agent, der...

Ikke kategoriseret

Cathie Wood: DeepSeek accelererer blot omkostningsreduktionsprocessen; den ekstremt koncentrerede markedsstruktur, der kan sammenlignes med den store depression, vil ændre sig

Afzddeepseeker 8. februar 20258. februar 2025

Højdepunkter Konkurrence med DeepSeek er godt for USA Cathie Wood: Jeg synes, det viser, at omkostningerne ved innovation falder dramatisk, og at denne tendens allerede er startet. For eksempel, før DeepSeek, faldt omkostningerne til træning af kunstig intelligens med 75% om året, og omkostningerne ved inferens faldt endda med 85% til...

Ikke kategoriseret

Google har frigivet tre nye modeller på én gang: Gemini-2.0-Pro er gratis, har en enestående score og rangerer først og er velegnet til kodning og behandling af komplekse prompter!

Afzddeepseeker 8. februar 20258. februar 2025

Historien om Gemini 2.0 accelererer. Flash Thinking Experimental-versionen i december bragte udviklere en fungerende model med lav latenstid og høj ydeevne. Tidligere i år blev 2.0 Flash Thinking Experimental opdateret i Google AI Studio for at forbedre ydeevnen yderligere ved at kombinere Flash-hastigheden med forbedrede inferensegenskaber. I sidste uge…

DeepSeek TOP17 bedste alternativer: omfattende analyse (2025)

Ikke kategoriseret

DeepSeek TOP17 bedste alternativer: omfattende analyse (2025)

Afdeepseeker 6. februar 20256. februar 2025

Introduktion I det hurtigt udviklende landskab af kunstig intelligens er DeepSeek dukket op som en kraftfuld sprogmodel. Denne omfattende analyse udforsker de 17 bedste alternativer til DeepSeek og undersøger deres unikke funktioner, muligheder og anvendelsesmuligheder. Vores forskning fokuserer på både internationale og kinesiske platforme, der tilbyder DeepSeek-integration eller lignende muligheder. Top Alternativer Analyse 1….

Ikke kategoriseret

Ali Qwen2.5-Max overhaler DeepSeek-V3! Netizen: Kinas AI lukker hurtigt hullet

Afzddeepseeker 5. februar 20255. februar 2025

Lige nu er endnu en indenlandsk model blevet tilføjet til Big Model Arena-listen fra Ali, Qwen2.5-Max, som overgik DeepSeek-V3 og blev nummer syv i den samlede rangliste med en samlet score på 1332. Den overgik også modeller som Claude 3.5 Sonnet og Llama 3.1 405B i ét fald. Især udmærker den sig i programmering...