zddeepseeker - Deepseek R1 - Pagina 2 van 3

Uncategorized

DeepSeek-R1-technologie onthuld: kernprincipes van het artikel worden afgebroken en de sleutel tot baanbrekende modelprestaties wordt onthuld

Doorzddeepseeker 9 februari 20259 februari 2025

Vandaag delen we DeepSeek R1, Titel: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM via reinforcement learning. Dit artikel introduceert de eerste generatie redeneermodellen van DeepSeek, DeepSeek-R1-Zero en DeepSeek-R1. Het DeepSeek-R1-Zero-model werd getraind via grootschalige reinforcement learning (RL) zonder supervised fine-tuning (SFT) als eerste stap,…

Uncategorized

DeepSeek R1-paperinterpretatie en belangrijkste technische punten

Doorzddeepseeker 9 februari 20259 februari 2025

1 Achtergrond Tijdens het Lentefestival trok DeepSeek R1 opnieuw veel aandacht, en zelfs het DeepSeek V3-interpretatieartikel dat we eerder schreven, werd opnieuw uitgezonden en veel besproken. Hoewel er veel analyses en reproducties van DeepSeek R1 zijn geweest, hebben we hier besloten om enkele bijbehorende leesnotities samen te stellen. We zullen drie…

Het low-cost model van Google, de Gemini 2.0-serie, valt aan: de strijd om kosteneffectiviteit in grote modellen wordt heviger

Uncategorized

Het low-cost model van Google, de Gemini 2.0-serie, valt aan: de strijd om kosteneffectiviteit in grote modellen wordt heviger

Doorzddeepseeker 8 februari 20258 februari 2025

De hoge kosten van het gebruik van grote AI-modellen zijn een belangrijke reden waarom veel AI-toepassingen nog niet zijn geïmplementeerd en gepromoot. Kiezen voor extreme prestaties betekent enorme kosten voor rekenkracht, wat leidt tot hoge gebruikskosten die gewone gebruikers niet kunnen accepteren. De concurrentie om grote AI-modellen is als een oorlog zonder rook. Na…

Gemini 2.0 domineert de hitlijsten, terwijl de DeepSeek V3 schreeuwt om zijn prijs. Een nieuwe, kosteneffectieve kampioen is geboren!

Uncategorized

Gemini 2.0 domineert de hitlijsten, terwijl de DeepSeek V3 schreeuwt om zijn prijs. Een nieuwe, kosteneffectieve kampioen is geboren!

Doorzddeepseeker 8 februari 20258 februari 2025

De Google Gemini 2.0-familie is eindelijk compleet! Het domineert de hitlijsten zodra het wordt uitgebracht. Te midden van de achtervolging en blokkades van Deepseek, Qwen en o3, bracht Google vanmorgen vroeg drie modellen in één keer uit: Gemini 2.0 Pro, Gemini 2.0 Flash en Gemini 2.0 Flash-Lite. Op de grote model LMSYS-ranglijsten, Gemini…

a16z-dialoog met 27-jarige CEO: AI Agent heeft een enorm hefboomeffect en de prijzen op lange termijn zullen gekoppeld zijn aan de arbeidskosten

Uncategorized

a16z-dialoog met 27-jarige CEO: AI Agent heeft een enorm hefboomeffect en de prijzen op lange termijn zullen gekoppeld zijn aan de arbeidskosten

Doorzddeepseeker 8 februari 20258 februari 2025

Hoogtepunten AI Agent verandert de klantervaring Jesse Zhang: Hoe wordt een Agent eigenlijk opgebouwd? Wij zijn van mening dat het na verloop van tijd steeds meer op een natuurlijke taalgebaseerde Agent zal lijken, omdat de grote taalmodellen (LLM's) op die manier worden getraind. Op de lange termijn, als je een superintelligente agent hebt die...

Uncategorized

Cathie Wood: DeepSeek versnelt alleen het proces van kostenreductie; de extreem geconcentreerde marktstructuur vergelijkbaar met de Grote Depressie zal veranderen

Doorzddeepseeker 8 februari 20258 februari 2025

Hoogtepunten Concurrentie met DeepSeek is goed voor de VS Cathie Wood: Ik denk dat het laat zien dat de kosten van innovatie dramatisch dalen en dat deze trend al is begonnen. Bijvoorbeeld, vóór DeepSeek daalden de kosten van het trainen van kunstmatige intelligentie met 75% per jaar en de kosten van inferentie daalden zelfs met 85% tot…

Uncategorized

Google heeft drie nieuwe modellen tegelijk uitgebracht: Gemini-2.0-Pro is gratis, heeft een uitstekende score en staat op de eerste plaats, en is geschikt voor het coderen en verwerken van complexe prompts!

Doorzddeepseeker 8 februari 20258 februari 2025

Het verhaal van Gemini 2.0 versnelt. De Flash Thinking Experimental-versie in december bracht ontwikkelaars een werkend model met lage latentie en hoge prestaties. Eerder dit jaar werd 2.0 Flash Thinking Experimental geüpdatet in de Google AI Studio om de prestaties verder te verbeteren door de snelheid van Flash te combineren met verbeterde inferentiemogelijkheden. Vorige week,…

Uncategorized

Ali Qwen2.5-Max haalt DeepSeek-V3 in! Netizen: Chinese AI dicht snel de kloof

Doorzddeepseeker 5 februari 20255 februari 2025

Zojuist is er nog een binnenlands model toegevoegd aan de Big Model Arena-lijst van Ali, Qwen2.5-Max, die DeepSeek-V3 overtrof en zevende werd in de algemene rangschikking met een totaalscore van 1332. Het overtrof ook modellen als Claude 3.5 Sonnet en Llama 3.1 405B in één klap. Het blinkt met name uit in programmeren…

Laatste nieuws! DeepSeek-onderzoeker onthult online: R1-training duurde slechts twee tot drie weken, en een krachtige evolutie van R1 zero werd waargenomen tijdens de Chinese Nieuwjaarsvakantie

Uncategorized

Laatste nieuws! DeepSeek-onderzoeker onthult online: R1-training duurde slechts twee tot drie weken, en een krachtige evolutie van R1 zero werd waargenomen tijdens de Chinese Nieuwjaarsvakantie

Doorzddeepseeker 4 februari 20254 februari 2025

Laatste nieuws! DeepSeek-onderzoeker onthult online: R1-training duurde slechts twee tot drie weken en er werd een krachtige evolutie van R1 zero waargenomen tijdens de Chinese Nieuwjaarsvakantie. We merkten net dat DeepSeek-onderzoeker Daya Guo reageerde op vragen van internetgebruikers over DeepSeek R1 en de plannen van het bedrijf voor de toekomst. We kunnen alleen maar zeggen...

DeepSeek R1 werd eerste in de creatief schrijven test, en o3 mini was nog slechter dan o1 mini!

Uncategorized

DeepSeek R1 werd eerste in de creatief schrijven test, en o3 mini was nog slechter dan o1 mini!

Doorzddeepseeker 3 februari 20253 februari 2025

DeepSeek R1 heeft het kampioenschap gewonnen in de benchmarktest voor het schrijven van creatieve korte verhalen, door de vorige dominante speler Claude 3.5 Sonnet met succes te overtreffen! Benchmarktest De benchmarktest, ontworpen door onderzoeker Lech Mazur, is geen doorsnee schrijfwedstrijd. Elk AI-model moest 500 korte verhalen schrijven en in elk verhaal moest op een slimme manier...