Nekategorizirano - Deepseek R1

Primerjava štirih najboljših modelov! Pregled prikazuje, kako zmogljiv je Deepseek R1

Avtor:zddeepseeker 1. junij 20251. junij 2025

V zadnjih nekaj dneh je bil Deepseek-R1 0528 uradno odprtokoden. Na LiveCodeBench je njegova zmogljivost skoraj na ravni OpenAI-jevega o3 (visoka); v Aiderjevem večjezičnem primerjalnem testu se kosa s Claude Opusom. Ko je bil predstavljen na uradni spletni strani, smo hitro preizkusili njegove zmogljivosti v vmesniku in ugotovili, da so izjemno ...

Nekategorizirano

Posodobitev DeepSeek-R1-0528: Globlje razmišljanje, močnejše sklepanje

Avtor:zddeepseeker 29. maj 202529. maj 2025

Model DeepSeek R1 je bil podvržen manjši nadgradnji, trenutna različica je DeepSeek-R1-0528. Ko vstopite na spletno stran ali v aplikacijo DeepSeek, v vmesniku za pogovor omogočite funkcijo »Globoko razmišljanje«, da izkusite najnovejšo različico. Uteži modela DeepSeek-R1-0528 so bile naložene na HuggingFace. V zadnjih štirih mesecih je bil DeepSeek-R1 podvržen…

Nekategorizirano

DeepSeek je izdal svojo izvorno kodo, podrobno razlago FlashMLA

Avtor:zddeepseeker 24. februar 202524. februar 2025

Prejšnji teden je DeepSeek napovedal, da bo naslednji teden odprtokodno pet projektov: uporabniki interneta so rekli: "Tokrat je OpenAI res tukaj." Pravkar je prišel prvi odprtokodni projekt, povezan s pospeševanjem sklepanja, FlashMLA: naslov odprtokodnega projekta: DeepSeek FlashMLA Odprtokodni je že dve uri, Github pa ima že 2,7k+ zvezdic: The…

Nekategorizirano

Kaj je FlashMLA? Obsežen vodnik o njegovem vplivu na jedra za dekodiranje AI

Avtor:deepseeker 24. februar 202524. februar 2025

FlashMLA je hitro pridobil pozornost v svetu umetne inteligence, zlasti na področju velikih jezikovnih modelov (LLM). To inovativno orodje, ki ga je razvil DeepSeek, služi kot optimizirano jedro za dekodiranje, zasnovano za Hopper GPE-je – visoko zmogljive čipe, ki se običajno uporabljajo v izračunih z umetno inteligenco. FlashMLA se osredotoča na učinkovito obdelavo zaporedij spremenljive dolžine, zaradi česar je še posebej primeren za ...

Nekategorizirano

Qwen2.5-max proti DeepSeek R1: Poglobljena primerjava modelov: popolna analiza aplikacijskih scenarijev

Avtor:zddeepseeker 14. februar 202514. februar 2025

Uvod Danes imajo veliki jezikovni modeli (LLM) ključno vlogo. V začetku leta 2025, ko se je konkurenca za AI zaostrila, je Alibaba lansirala nov model AI Qwen2.5-max, DeepSeek, podjetje iz Hangzhouja na Kitajskem, pa model R1, ki predstavlja vrhunec tehnologije LLM. Deepseek R1 je odprtokodni model AI, ki je pritegnil ...

Nekategorizirano

Je blizu DeepSeek-R1-32B in zdrobi s1 Fei-Fei Li! UC Berkeley in drugi odprtokodni novi modeli sklepanja SOTA

Avtor:zddeepseeker 14. februar 202514. februar 2025

Inferenčni model 32B uporablja le 1/8 podatkov in je povezan z DeepSeek-R1 enake velikosti! Pravkar so ustanove, kot so Stanford, UC Berkeley in Univerza v Washingtonu, skupaj izdale model sklepanja na ravni SOTA, OpenThinker-32B, in prav tako odprle do 114k podatkov o usposabljanju. Domača stran projekta OpenThinker: OpenThinker Hugging Face:…

Nekategorizirano

Artefakti upravljanja velikih jezikovnih modelov, kot je DeepSeek: Cherry Studio, Chatbox, AnythingLLM, kdo je vaš pospeševalnik učinkovitosti?

Avtor:zddeepseeker 11. februar 202511. februar 2025

Številni ljudje so že začeli uvajati in uporabljati velike jezikovne modele Deepseek lokalno, pri čemer uporabljajo Chatbox kot orodje za vizualizacijo. Ta članek bo še naprej predstavljal dva druga artefakta upravljanja in vizualizacije velikih jezikovnih modelov umetne inteligence in jih bo podrobno primerjal, da boste lahko učinkoviteje uporabljali velike jezikovne modele umetne inteligence. Leta 2025 je…

Nekategorizirano

Le Chat je na vrhu lestvice s sto milijardami dolarjev naložbe. Je po ZDA in Kitajski tretja sila AI?

Avtor:zddeepseeker 11. februar 202511. februar 2025

Francoski predsednik Emmanuel Macron je 9. februarja napovedal, da bo Francija v naslednjih nekaj letih v področje umetne inteligence vložila 109 milijard evrov (113 milijard ameriških dolarjev). Ta naložba bo uporabljena za izgradnjo parka umetne inteligence v Franciji, izboljšanje infrastrukture in naložbe v lokalna zagonska podjetja z umetno inteligenco. Medtem je Mistral, francoski startup, ...

Nekategorizirano

Kaj lahko doseže Deepseek? Tudi OpenAI tega ne zmore?

Avtor:zddeepseeker 10. februar 202510. februar 2025

Prava vrednost DeepSeek je podcenjena! DeepSeek-R1 je nedvomno prinesel nov val navdušenja na trg. Ne samo, da so relevantni tako imenovani cilji upravičencev strmo naraščali, ampak so nekateri ljudje celo razvili tečaje in programsko opremo, povezane z DeepSeek, da bi z njim zaslužili. Verjamemo, da čeprav imajo ti pojavi …

Nekategorizirano

Glavni izdelki umetne inteligence na svetu se osredotočajo na analizo in celovite smernice za uporabniško izkušnjo (vključno z DeepSeek in GPT)

Avtor:zddeepseeker 10. februar 202510. februar 2025

Postavitev funkcij in analiza osnovnih prednosti ChatGPT (OpenAI) – globalno merilo uspešnosti za vsestranske ChatGPT Tehnični geni: generativni AI, ki temelji na seriji velikih modelov GPT, s splošnimi pogovornimi veščinami in logičnim sklepanjem kot glavnima prednostma. Večjezična obdelava: najbolje deluje v angleščini, z nenehnim izboljševanjem v kitajščini; vendar priporočamo uporabo angleščine za ...