V zadnjih nekaj dneh je bil Deepseek-R1 0528 uradno odprtokoden.

Na LiveCodeBenchu je njegova zmogljivost skoraj na ravni OpenAI-jevega o3 (visoka); v Aiderjevem večjezičnem primerjalnem testu se kosa s Claude Opusom.

Ko je bil predstavljen na uradni spletni strani, smo hitro preizkusili njegove zmogljivosti v vmesniku in ugotovili, da so izjemno močne, kar je privedlo do testov, ki jih obravnavamo v tem članku. Z vami želimo deliti specifično delovanje različnih modelov.

Pomembno je omeniti, da se ta test osredotoča predvsem na zmogljivosti sprednjega dela, zato je bistveno, da objektivno ocenite delovanje različnih modelov. Z navodili, ki jih ponujamo, lahko izvedete lastne teste in delite svoje vpoglede in ugotovitve.

Z istim pozivom smo ga poslali Claudeu Opusu 4, Sonnetu 4, Geminiju 2.5 Pro in DeepSeek R1-0528in jih povabil, da se pomerijo v šestih vse bolj zahtevnih nalogah razvoja front-enda.

Za tiste, ki ne morete čakati, je tukaj zaključek:

Deepseek-R1-0528 nekoliko zaostaja za Opusom 4 v zmogljivostih sprednjega dela, vendar ga prekaša Sonet 4 in Gemini 2.5 Pro.

V bistvu lahko R1 opravi vsako nalogo, ki jo lahko opravi Opus, in celo naloge, ki jih Opus 4 ne more opraviti, lahko opravi R1, čeprav z nekoliko nižjo stopnjo dokončanja in kakovostjo rezultatov.

Glede na razliko v ceni med R1 in ostalimi tremi je ta zmogljivost že odlična in si lahko samo predstavljamo, kako impresiven bo R2.

Test 1: Sistem za upravljanje skladišč

Vprašanje: Prosim, pomagajte mi ustvariti celovito spletno orodje za upravljanje izdelkov z naslednjimi zahtevami:

Funkcionalne zahteve

  1. Upravljanje izdelkov
  • Vnos podatkov o izdelkuIme izdelka, vrsta/kategorija, številka SKU, cena, količina na zalogi
  • Upravljanje podobe izdelkaPodpora za nalaganje in predogled slik (simulirano z izbirnikom datotek)
  • Prikaz seznama izdelkov: Prikažite vse izdelke v obliki tabele s podporo za iskanje in filtriranje
  • Urejanje izdelkovSprememba informacij o podpori izdelka
  • Brisanje izdelkaPodpora za brisanje izdelka (s potrditvenim pozivom)
  1. Upravljanje zalog
  • Vhodne operacijePovečajte količino zalog izdelkov, zabeležite čas in količino dohodka
  • Odhodne operacijeZmanjšajte količino zalog izdelkov, zabeležite čas in količino odhoda
  • Zapisi o inventarju: Prikaže zgodovino sprememb zalog za vsak izdelek
  1. Funkcije vmesnika
  • Nadzorna plošča: Prikazuje statistiko, kot so skupno število izdelkov, skupna vrednost zalog, opozorila o nizki zalogi itd.
  • Odziven dizajnPrilagodljivo za namizne računalnike in mobilne naprave
  • Vztrajnost podatkov: Uporablja localStorage za shranjevanje podatkov

Tehnične zahteve

Slogi in ikone

  • Okvir CSSUporablja TailwindCSS 3.0+ CDN
  • Knjižnica ikonUporablja ikone junakov ali perja CDN
  • PisavaUporabite Google pisave

Struktura kode

  • Enostranična prijavaHTML + CSS + JavaScript
  • Modularna zasnovaRazdelite funkcije v različne module JavaScript
  • Oblika podatkovZa shranjevanje podatkov o izdelku uporabite format JSON

Zahteve za oblikovanje vmesnika

  • Sodoben uporabniški vmesnikPreprosta in lepa zasnova vmesnika
  • Barvna shemaUporabite profesionalne poslovne barvne kombinacije
  • Interaktivne povratne informacijeKliki gumbov, preverjanje obrazcev in drugi interaktivni učinki
  • Validacija obrazca: Preverjanje obveznega polja, preverjanje oblike podatkov

Primer podatkovne strukture

Prosimo, ustvarite celotno datoteko HTML, ki vsebuje vso potrebno kodo CSS in JavaScript, ter zagotovite, da so vse funkcije delujoče in se lahko izvajajo neposredno v brskalniku.

Oglejmo si rezultate testiranja. Logika je pravzaprav precej zapletena, saj preizkuša kontekstno dolžino modela, estetski čut in zmožnosti logične obdelave.

V tem primeru so vsi modeli razen Deepseeka odpovedali. Claude 4-jev prevod je bilo precej zmedeno, če sem iskren.

Deepseek-R1-0528: Nadgrajena različica R1 je zelo zmogljiva. Kot lahko vidite, je vmesnik zelo profesionalen, poleg tega pa lahko ustvarjate nove izdelke, izvajate običajne izhodne in vhodne operacije ter razdelite poročila o izdelkih, upravljanju zalog in zalogah na tri strani, kar je na splošno zelo pregledno. Obstaja tudi namenska stran nadzorne plošče, napisal pa je tudi nekaj vzorčnih podatkov za testiranje. Drugi modeli nimajo podatkov in dodajanje izdelkov ne deluje, zato je testiranje popolnoma nemogoče.

Claude, opus 4: Začne se z velikim, zelo preprostim vmesnikom, ki uporablja zgornjo navigacijsko vrstico namesto stranske vrstice, ki je običajna na platformah SaaS. Dodajanje izdelkov povzroči napako pri shranjevanju, zaradi česar je testiranje nemogoče.

Claude Sonnet 4: V primerjavi z Opusom 4 je vmesnik še bolj osnoven. Na klik gumba »Dodaj izdelek« se ne odzove in ne prikaže se nobeno pojavno okno obrazca. Druge strani so v bistvu le nadomestni elementi.

Gemini 2.5 Pro: Googlova različica je boljša od Claudeove. Omogoča dodajanje izdelkov in serij, vendar so napake. Delovalo je, ko sem jo prvič preizkusil, ne pa tudi, ko sem posnel video. Vendar je interakcijska zasnova Geminija precej zapletena, saj je upravljanje zalog in vodenje evidenc v eni tabeli, kar povzroča nekaj težav.

Test 2: Urejevalnik animacij pikslov

Sledi preizkus vizualnih sposobnosti. Prosil sem jih, naj ustvarijo urejevalnik animacij s slikovno grafiko z uporabo P5.js, ki podpira načine gibanja, prilagaja oblike, velikosti, hitrosti in druge pogoje točk.

Naloga: Ustvarite generator interaktivnih animacij s slikovnimi elementi za celozaslonski način, ki temelji na P5.js in izpolnjuje naslednje tehnične zahteve:

Osnovne funkcije

  • Implementirajte celozaslonsko animacijo slikovnih pik z uporabo P5.js, pri čemer animacija pokriva celotno območje vidnega polja.
  • Skupna površina mreže slikovnih pik mora biti vsaj 10-krat večja od vidne površine, da se zagotovi popolna pokritost tudi pri najmanjšem razmiku mreže.
  • Zagotavlja več načinov animacije: valovanje, pulziranje, valovanje, šum
  • Podpira več možnosti oblike točk: krog, kvadrat, križ, trikotnik, diamant itd.
  • Vse nadzorne plošče so nameščene na desni strani in jih je mogoče na mobilnih napravah strniti na dno.

Nastavljivi parametri

  • Gostota pik: Nadzorujte število pik na vrstico/stolpec
  • Velikost oblike: Prilagodite velikost pik
  • Hitrost animacije: Nadzorujte hitrost in amplitudo animacijskega učinka
  • Razmik mreže: Prilagodite razdaljo med pikami

Tehnične specifikacije

  • Uporabljajte HTML5, TailwindCSS 3.0+ (predstavljeno prek CDN) in P5.js
  • Izvedite popolno funkcionalnost preklapljanja med temnim in svetlim načinom, privzeto na sistemske nastavitve
  • Koda mora vključevati logiko za optimizacijo delovanja, ki prikazuje le točke znotraj vidnega območja in blizu robov.
  • Animacije morajo teči gladko in brez zamika

Odziven dizajn

  • Strani se morajo brezhibno prikazovati na vseh napravah (mobilnih telefonih, tablicah, namiznih računalnikih)
  • Nadzorne plošče bi morale biti v mobilnem pogledu zložljive/razširljive
  • Optimizirajte postavitev in velikosti pisav za različne velikosti zaslona
  • Zagotovite dobro izkušnjo na dotik na mobilnih napravah

Elementi vmesnika

  • Izbirnik načina animacije (val, pulz, valovanje, šum)
  • Izbirnik oblik (prikazuje različne oblike z ikonami)
  • Drsniki: gostota, velikost, hitrost, razmik
  • Gumb za preklop teme
  • Prikaži informacije o prekrivni matriki in skupno število točk

Poglejte si rezultate. Iskreno povedano, nisem pričakoval, da se bodo drugi modeli v tem testu odrezali tako slabo. Razen pri Deepseek-R1 animacije drugih modelov sploh niso delovale.

Deepseek-R1-0528: Popolnoma brezhibno. Vsak gumb in drsnik deluje normalno, pike pa se premikajo gladko. Dodal je celo matrične podatke, barve pa ostanejo dosledne tudi po preklopu v nočni način. Edina manjša težava je, da ima izbrano stanje izbire barv manjšo težavo, vendar je to zanemarljivo v primerjavi s katastrofalno zmogljivostjo drugih modelov.

Claude, opus 4: Dobra novica: ima slikovno pikslo. Slaba novica: se ne premika. Vsebino na desni strani je mogoče normalno upravljati, vendar je barvna shema po preklopu v nočni način napačna.

Claude Sonnet 4: Ta je katastrofa. Ni pikslovne grafike in celo stanje izbire gumbov manjka. Drsniki so samo pike – lahko bi uporabili privzete komponente.

Gemini 2.5 Pro: Prav tako poroča o napaki brez mreže slikovnih pik. Vsebino na desni strani je mogoče normalno upravljati, preklapljanje med temami pa deluje v redu, vendar so privzete komponente nekoliko grde.

Preizkus 3: Orodje za ekstrakcijo barvnih gradientov slik

To je orodje, ki sem ga napisal prej. Ni veliko opisa logike, je pa več opisa sloga. Glavna funkcija je izluščiti pet nizov barvnih prelivov iz slike.

Poziv: Na podlagi naslednje vsebine datoteke ustvarite spletno stran HTML, podprite ekstrakcijo petih nizov barvnih prelivov iz naloženih slik in uporabnikom omogočite neposredno kopiranje petih nizov šestnajstiških barvnih prelivov. Implementirati je treba funkcijo za ekstrakcijo barv.

  1. Uporabite vizualno oblikovanje v slogu NetEase Cloud Music, belo ozadje z barvo, podobno #FE1110, kot poudarek
  2. Poudarite ključne točke z velikimi pisavami ali številkami. Vključite prevelike vizualne elemente, da poudarite področja, na katera se osredotočate, in ustvarite kontrast z manjšimi elementi.
  3. Mešajte kitajsko in angleško besedilo. Za naglasi uporabite krepke, velike kitajske znake in manjše angleško besedilo.
  4. Za vizualizacijo podatkov ali kot dekorativne elemente uporabite preproste črtno narisane grafike.
  5. Za ustvarjanje tehnološko navdihnjenega učinka uporabite preliv prosojnosti barv poudarkov, vendar pazite, da se različne barve poudarkov ne zlivajo med seboj.
  6. Posnema animacije uradne spletne strani Apple, s pomikanjem miške, ki sproži animacije
  7. Na podatke se je mogoče sklicevati iz spletnih komponent grafikonov, s slogi, ki so skladni s temo
  8. Uporabite Framer Motion (prek CDN-ja)
  9. Uporabite HTML5, TailwindCSS 3.0+ (prek CDN-ja) in potreben JavaScript
  10. Uporabite profesionalne knjižnice ikon, kot sta Font Awesome ali Material Icons (prek CDN-ja)
  11. Izogibajte se uporabi emojijev kot primarnih ikon
  12. Gumb kapsule v spodnjem levem kotu prikazuje avtorjevo uporabniško ime na Twitterju.

V tem primeru je Claude končno opravil odlično delo. Podrobnosti in estetika strani Deepseek-R1-0528 so impresivne, vendar funkcionalnost ni implementirana. Strani Opus 4 in Sonnet 4 so preprostejše, a vsaj funkcionalne, medtem ko Gemini sploh ne deluje.

Deepseek-R1-0528: Po ponovni uporabi mojega poziva je estetika Deepseekove strani resnično neprekosljiva. Na stran je dodal tudi veliko vsebine, prijazne za SEO, kot so scenariji aplikacij in časi obdelave. Kartice z gradientnimi barvami so prav tako zelo podrobne, vendar logika izbire barv ni implementirana.

Claude, opus 4: Tokrat Claude končno ni razočaral in je dokončal funkcionalnost strani, vendar je vsebina strani zelo osnovna, saj je na voljo le prostor za nalaganje slik in rezultatov, logika izbiranja barv pa je prav tako slaba. Vendar vsaj deluje.

Claude Sonnet 4: Tudi Sonnet 4 je funkcionalnost dokončal in mislim, da so Sonnetovi rezultati celo boljši od Opusovih, čeprav še vedno ni tako bogat kot Deepseek.

Gemini 2.5 Pro: Ta je najslabša. Ne samo, da manjkajo podrobnosti in estetika strani, ampak tudi funkcionalnost ni implementirana in se ob zagonu sesuje.

Test 4: Spletna stran z dnevnimi citati o belem šumu

Sledi generator spletnih strani z dnevnimi citati z belim šumom, ki je odličen za vtičnik za nov zavihek. Podpira predvajanje belega šuma iz Spotifyja, spletna stran pa se prikaže

Vprašanje: Prosim, pomagajte mi ustvariti preprosto in elegantno spletno stran za dnevne ponudbe z naslednjimi zahtevami:

Vizualno oblikovanje

  • Slika ozadja: Naključno izberite visokokakovostne slike pokrajine iz naslednjih povezav kot sliko ozadja
  • Povezave slikXXXX
  • Obdelava slikDodajte črno masko 25% in rahlo Gaussovo zameglitev, da zagotovite jasno in berljivo besedilo.
  • Splošni slogMinimalistično in moderno, s slikami pokrajine kot ozadjem spletne strani za boljšo poglobljenost
  • Za animacijski okvir uporabite anime.js (predstavljeno prek CDN: JsDelivr jsdelivr.com), HTML5, TailwindCSS 3.0+ (predstavljeno prek CDN) in potreben JavaScript ter profesionalne knjižnice ikon, kot sta Font Awesome ali Material Icons (predstavljeno prek CDN).

Modul za prikaz časa

  • Zgoraj: Prikažite obliko meseca in dneva (npr. »29. maj«) z manjšo pisavo in poravnano na sredino.
  • Druga vrsta: Prikaže obliko »Teden X · Lunin koledar X. mesec X. dan« v manjši pisavi
  • CenterOznači trenutni datum z veliko belo pisavo, na sredini

Modul za prikaz ponudb

  • VsebinaNaključno prikazuje klasične citate kitajskih in tujih filozofov in pisateljev
  • PostavitevCitati so centrirani, velikost pisave je zmerna, razmik med vrsticami pa udoben.
  • Pripis avtorstva: V spodnjem desnem kotu je prikazano »Pisatelj, XXX« ali »Filozof, XXX«
  • Knjižnica citatovVsebuje citate o različnih temah, kot so motivacija, življenjski vpogledi in modrost

Funkcija predvajanja glasbe

  • LokacijaSpodnji levi kot strani, privzeto strnjen
  • VsebinaVdelaj seznam predvajanja belega šuma Spotify
  • Koda:

Tehnična izvedba

  • Odziven dizajnPrilagojeno za namizne računalnike in mobilne naprave
  • Izbira pisaveUporabite elegantne kitajske pisave, ki jih je predstavil Google Fonts
  • Barvna shemaZa zagotovitev berljivosti na vseh ozadjih uporabljajte predvsem belo besedilo.
  • Optimizacija nalaganjaPočasno nalaganje slik za izboljšanje delovanja strani

Interaktivne funkcije

  • Samodejno osvežitev: Samodejno spreminja sliko ozadja in citat vsak dan
  • Ročna osvežitev: Zagotavlja gumb za osvežitev, ki uporabnikom omogoča ročno spreminjanje vsebine

Slog pisanja besedil

  • Izbira ponudbRaje kratke, pozitivne in filozofske citate
  • Jezikovni slogJedrnato in močno, brez pretirane dolžine
  • Klasifikacija temŽivljenjski vpogledi, navdihujoča rast, modre misli, izražanje čustev itd.

Prosimo, ustvarite celotno spletno mesto HTML/CSS/JavaScript v skladu z zgornjimi zahtevami, pri čemer zagotovite, da je vmesnik estetsko privlačen, funkcionalen in zagotavlja dobro uporabniško izkušnjo.

Ta test je namenjen zgolj oceni razumevanja estetike vsakega modela. Ta vrsta spletne strani, usmerjene v prikaz, je na splošno dosegljiva.

Treba je povedati, da je Claude Opus 4 na tem področju še vedno precej avtoritativen, z odlično pozornostjo do detajlov. Tudi Gemini 2.5 Pro je dober, celo dodaja animacijske učinke prehodom slik. Deepseek in Sonnet 4 sta na isti ravni.

Deepseek-R1-0528: Najprej sem zagnal Deepseek in se mi je zdel že kar dober. Prva težava s splošno estetiko je bil gumb za glasbo v spodnjem levem kotu, ki je bil nekoliko preveč raven. Tudi razdelek s citati je imel težave – črna maska ne bi smela biti dodana, poravnava besedila pa je bila nekoliko napačna. Vendar pa je dodal animacijski učinek za osvežitev.

Claude, opus 4: Estetika Opusa 4 je resnično brezhibna. Velikost in razmik med pisavami sta zelo udobna, citati znanih izrekov pa so obdelani s preglednostjo tako za besedilo citata kot za narekovaje. Celo predvajalnik Spotify je ovit v uporabniški vmesnik z animacijo razširitve/strnitve. To je popolno.

Claude Sonnet 4: Učinek Sonneta 4 je podoben kot pri Deepseeku. Gumb za predvajanje glasbe, velikost besedila, poravnava in razmik se lahko dodatno optimizirajo.

Gemini 2.5 Pro: Tudi učinek Geminija je dober, vendar bi ga odstranitev sence besedila izboljšala. Prilagodila je tudi uporabniški vmesnik predvajalnika Spotify, podrobnosti besedila pa so v redu. Opazen je prehodni učinek z učinkom raztezanja slike.

Test 5: Generiranje strani aplikacije za spanje

Sledi preizkus mobilne aplikacije. Naj vsak ustvari aplikacijo za spremljanje spanja. V pozivu bodo navedeni tehnični sklad in zahteve glede oblikovanja ter zahtevana je bila generiranje več interaktivnih strani.

Poziv: Zahteve za razvoj aplikacije za spremljanje spanja

Pregled projekta

Prosim, pomagajte mi ustvariti celovito aplikacijo za spremljanje spanja s štirimi glavnimi funkcionalnimi stranmi. Vmesnik mora biti estetsko privlačen in profesionalen.

Tehnične zahteve sklada

Tehnologije frontenda

HTML5 – Struktura strani

TailwindCSS v3.0+ – Okvir sloga (uveden prek CDN)

JavaScript – Potrebna logika interakcije

Anime.js v4.0.2 – Knjižnica animacijskih učinkov

  • CDN: https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm

Ikone in grafikoni

  • Knjižnica ikon: Font Awesome ali Material Icons (CDN)
  • Komponente grafikona: Slog spletnih komponent grafikona mora biti skladen s temo
  • Vizualizacija podatkov: Podpira prikaz podatkov o spanju v obliki grafikonov

Zahteve glede oblikovanja

Odziven dizajn

  • Popolnoma odzivna postavitev
  • Oblikovanje, osredotočeno na mobilne naprave
  • Dober prikaz tako na namiznih kot mobilnih napravah

Učinki interakcije

  • Interakcija gumbov: Rahlo povečan učinek pri lebdenju

Interakcija z obrazcem: Prikaz prelivnega roba, ko je vnosno polje v fokusu

Interakcija s kartico: Potemni senco pri lebdenju

Animacijski učinki: Uporabite Anime.js za doseganje gladkih animacij strani

Zahteve funkcionalne strani

Prosimo, ustvarite vse strani, potrebne za aplikacijo za spremljanje spanja, vključno z, vendar ne omejeno na:

  • Domača stran/nadzorna plošča
  • Stran z zapisom spanja
  • Stran za analizo podatkov
  • Stran z nastavitvami
  • Druge povezane funkcionalne strani

Zahteve za izhod kode

  • Vsaka stran je neodvisna datoteka HTML
  • Jasna struktura kode s popolnimi komentarji
  • Zagotovite dostop do vseh povezav CDN
  • Zagotovite popolno, izvedljivo kodo

Kar zadeva mobilno logiko in vmesnik, je Cluade Opus 4 znova dokazal svojo moč, saj je z dobro logiko izpolnil več strani. Drugi modeli so ustvarili le eno stran, toda Deepseek R1 0528 je nenadoma dosegel vrhunec v estetskem smislu s čudovitim slogom. Čeprav je ustvaril le eno stran, je bil zelo dovršen.

Deepseek-R1-0528: Ustvarjena je bila samo ena stran, vendar je celotna estetika dobra. Podrobnosti kartic in upravljanje ikon so dobro narejene, celotna stran pa je popolna in dolga. Poleg tega je bila za navigacijo implementirana odzivna zasnova, kar je povzročilo popolnoma različne postavitve na mobilnih in namiznih napravah.

Claude, opus 4: Resnično zmogljivo, le Opus4 je v celoti ustvaril vse strani, vendar estetska zasnova tokrat ni odlična, uporablja logiko spletnih strani z premajhnimi navigacijskimi ikonami.

Claude Sonnet 4: Ustvaril samo eno stran in prijavil napake, s slabo estetsko zasnovo, nalogo sem komaj dokončal.

Gemini 2.5 Pro: Google vedno dela stvari drugače. Vsako stran ustvari posebej in zagotovi štiri datoteke, ki ne morejo medsebojno delovati. Poleg tega so vse strani poročale o napakah, saj je vsaka vsebovala samo navigacijo in nobene vsebine, kar je precej razočarajoče.

Test 6: Kompleksna funkcionalnost – Tetris

Na koncu sem zaključil z majhnim preizkusom igre. Zasnoval sem relativno kompleksno igro Tetris s posebnimi bloki, preklapljanjem tem, napovedovanjem pristajanja blokov, shranjevanjem blokov in še več – pravi ultimativni izziv.

Vprašanje: Prosim, pomagajte mi ustvariti popolnoma delujočo, vizualno privlačno spletno igro Tetris z naslednjimi zahtevami:

Osnovne funkcije igre

  1. Celoten mehanizem Tetrisa7 standardnih blokov (I, O, T, S, Z, J, L)
  2. Gladko upravljanje: gibanje levo in desno, vrtenje, hiter spust, takojšen spust
  3. Pametni sistem izločanja: podpira odstranjevanje 1-4 vrstic hkrati s posebnimi animacijskimi učinki
  4. Progresivni sistem težavnosti: samodejno poveča hitrost in raven padanja glede na število izločenih vrstic

Napredne funkcije

  1. Sistem predogleda: prikaže naslednji in naslednji blok
  2. Funkcija zadrževanja: Držite tipko Hold, da začasno shranite trenutni blok. Uporabite jo lahko le enkrat na rundo.
  3. Duhovni bloki: Prikaže položaj pristanka blokov v polprosojni obliki
  4. Kombinirani sistemNeprekinjeno čiščenje prinaša dodatne točke in vizualne učinke
  5. Posebne spretnosti:
    1. Blokada bomb (počisti okolico)
    2. Lasersko čiščenje (počisti celotno vrstico)
    3. Časovna pavza (bloki prenehajo padati 3 sekunde)

Zahteve za vizualno oblikovanje

  1. Sodoben uporabniški vmesnik:
    1. Gradientno ozadje ali učinki delcev
    2. Igralna plošča z učinkom stekla
    3. Gladki prehodi animacije
    4. Odziven dizajn za različne zaslone
  2. Bogati vizualni učinki:
    1. Gladka animacija padajočih in vrtečih se blokov
    2. Učinki eksplozije ali bliska ob odpravi
    3. Učinek tresenja zaslona, ko dosežete kombinacijo
    4. Animacija praznovanja ob nadgradnji ravni
  3. Sistem temVsaj 3 različne vizualne teme za preklapljanje med

Sistem zvočnih učinkov

  1. Popolne zvočne povratne informacije: gibanje, rotacija, pristanek, izločitev, konec igre itd.
  2. Glasba v ozadju: zankajoča se glasba v igri
  3. Nadzor glasnosti: neodvisno nastavljivi zvočni učinki in glasnost glasbe v ozadju

Igralni načini

  1. Klasični način: tradicionalno igranje Tetrisa
  2. Časovno omejen način: doseči najvišji rezultat v določenem časovnem roku
  3. Način izziva: vnaprej določene ovire za povečanje težavnosti
  4. Zen načinbrez časovnega pritiska, čisti užitek v igri

Funkcije statistike podatkov

  1. Statistika v realnem času: trenutni rezultat, raven, število očiščenih črt, čas igre
  2. Zgodovinanajvišji rezultat, najvišja raven, skupni čas igre
  3. Sistem dosežkov: odklenite različne igralne dosežke
  4. Lokalno shranjevanje: shranjevanje zapisov in nastavitev igre

Tehnične zahteve

  1. Uporablja čisti HTML5/CSS3/JavaScript, zunanji okviri niso potrebni
  2. Jasna struktura kodeobjektno usmerjeno programiranje, modularna zasnova
  3. Optimizacija delovanja: gladka animacija s 60 FPS, brez zamika
  4. Združljivost: podpira sodobne brskalnike
  5. Odziven dizajnZdružljivo z osebnimi računalniki in mobilnimi napravami

Uporabniška izkušnja

  1. Intuitivna navodilaVgrajeni vodnik in pozivi z gumbi
  2. Funkcija za premor/nadaljevanje: Igro lahko kadar koli začasno ustavite
  3. Meni z nastavitvamiPrilagodite težavnost igre, zvočne učinke, vizualne učinke itd.
  4. Shranjevanje stanja igre: Podpira shranjevanje in nadaljevanje igre

Zahteve glede kakovosti kode

  1. Podrobni komentarjiVsaka funkcija in pomemben segment kode mora imeti opis
  2. Obravnavanje napakCelovit mehanizem za zajemanje in obravnavo izjem
  3. Elegantna kodaSledite najboljšim praksam, enostavno za razumevanje in vzdrževanje
  4. RazširljivostEnostavno dodajanje novih funkcij v prihodnosti

Prosimo, da predložite celotne datoteke HTML, ki vsebujejo vso kodo CSS in JavaScript, da zagotovite, da jih je mogoče zagnati neposredno v brskalniku. Koda mora dokazovati profesionalne programerske sposobnosti in poglobljeno razumevanje razvoja iger.

V mini igri se Claudeu nekaj dogaja. Tako Opus kot Sonnet sta po potrebi ustvarila ustrezne bloke Tetris, zlasti logiko za posebne bloke. Deepseek je obravnaval temo, ki jo je Claude spregledal, vendar je zgrešil posebne bloke, zaradi česar je Gemini 2.5 Pro ustvaril neigrljive bloke.

Deepseek-R1-0528: Naloga je bila opravljena zelo dobro in v skladu s specifikacijami, vendar je bila posebna zasnova blokov izpuščena in sploh ni bila izvedena. To je morda posledica težav pri sledenju besedilom v pozivu. Celotna spletna stran je podobna igralnemu vmesniku, vsi gumbi pa so videti kot standardne komponente.

Claude, opus 4: Logiko za posebne bloke in drugo logiko je dokončal brez težav, vendar je prezrl poziv za preklapljanje teme, ki ga ni implementiral. V primerjavi s težavami DeepSeek je to manjša težava, vendar je vmesnik trdo kodiran brez odzivne logike, zato so razmerja nekoliko napačna, zaradi česar nekaterih gumbov ni mogoče klikniti.

Claude Sonnet 4: Podobno kot Opus, vendar mislim, da je Sonnet 4 boljši od Opusa. Prilagajanje strani je tudi dobro. Zdi se, da je Sonnet zmagal, saj je izpolnil vse zahtevane funkcije.

Gemini 2.5 Pro: Gemini se nenehno bori s kompleksno logiko. Tokrat je bil popolnoma neuporaben, ker je imela postavitev kock napako, zaradi katere ni bilo mogoče predvideti, kje bodo pristale. To je najhuje.

Mislim, da ste do zdaj prav tako kot jaz navdušeni nad zmogljivostjo DeepSeek-R1.

Težko je verjeti, da gre le za majhno nadgradnjo modela. Primerjajmo cene teh modelov z DeepSeek R1 0528.

Opus 4 je 30-krat dražji, in to ob uporabi cen Openrouterja – uradna cena bi bila še bolj osupljiva.

modelDolžina kontekstaVhodna cena (žetoni $/M)Izhodna cena (žetoni $/M)cena slike ($/K žetonov)
DeepSeek R1 0528160 tisoč0.502.18
Predogled Gemini 2.5 Pro1000 tisoč1.25105.16
Claude Sonnet 4200 tisoč3.00154.80
Claude Opus 4200 tisoč15.007524.00

Kot nekdo, ki se dnevno ukvarja z novicami o umetni inteligenci, sem bil priča neštetim "prebojem", ki so se na koncu izkazali za "razočarajoče". Toda tokrat je drugače. DeepSeek-R1 mi je dal resnično upanje.

30-kratna razlika v ceni, a skoraj enakovredna zmogljivost.

Ni nam več treba plačevati pretiranih cen za uporabo najboljših modelov programiranja umetne inteligence, niti nam ni treba sklepati bolečih kompromisov med stroški in kakovostjo. Še bolj navdihujoče je, da je to naš lastni model.

Ta stavek je napisala umetna inteligenca in mislim, da je odličen: Prava revolucija se pogosto začne, ko lahko navadni ljudje dosežejo zvezde.

Podobne objave

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja