Per pastarąsias kelias dienas „Deepseek-R1 0528“ buvo oficialiai paskelbtas atvirojo kodo.
„LiveCodeBench“ teste jo našumas beveik prilygsta „OpenAI“ „o3“ (aukštas); „Aider“ daugiakalbiame lyginamajame teste jis nenusileidžia „Claude Opus“.
Kai jis buvo paleistas oficialioje svetainėje, mes greitai išbandėme jo priekinės dalies galimybes ir nustatėme, kad jos yra itin stiprios, todėl buvo atlikti šiame straipsnyje aprašyti testai. Siekiame pasidalyti su jumis skirtingų modelių našumo ypatybėmis.
Svarbu pažymėti, kad šis testas daugiausia dėmesio skiria priekinės dalies galimybėms, todėl labai svarbu objektyviai įvertinti skirtingų modelių našumą. Galite naudoti mūsų pateiktas užduotis, kad atliktumėte savo testus ir pasidalytumėte savo įžvalgomis bei rezultatais.
Naudodami tą pačią užduotį, išsiuntėme ją į „Claude Opus 4“, „Sonnet 4“, „Gemini 2.5 Pro“ ir DeepSeek R1-0528ir liepė jiems varžytis šešiose vis sudėtingesnėse front-end kūrimo užduotyse.
Tiems, kurie nekantrauja, pateikiame išvadą:
„Deepseek-R1-0528“ šiek tiek atsilieka nuo „Opus 4“ pagal priekinės dalies galimybes, bet jį lenkia. Sonetas 4 ir „Gemini 2.5 Pro“.
Iš esmės bet kurią užduotį, kurią gali atlikti „Opus“, gali atlikti ir R1, ir net užduotis, kurių negali atlikti „Opus 4“, gali atlikti R1, nors jų atlikimo rodikliai ir rezultatų kokybė yra šiek tiek mažesni.
Atsižvelgiant į kainų skirtumą tarp R1 ir kitų trijų, šis našumas jau yra puikus, ir galime tik įsivaizduoti, koks įspūdingas bus R2.
1 testas: Sandėlio valdymo sistema
Užduotis: Prašau padėti man sukurti išsamią žiniatinklio pagrindu veikiančią produktų valdymo priemonę, atitinkančią šiuos reikalavimus:
Funkciniai reikalavimai
- Produktų valdymas
- Produkto informacijos įvedimasProdukto pavadinimas, tipas / kategorija, SKU numeris, kaina, kiekis atsargose
- Produkto vaizdų valdymas: Palaikomas vaizdų įkėlimas ir peržiūra (imituojama failų parinkimo įrankiu)
- Produktų sąrašo rodymas: Rodyti visus produktus lentelės formatu su paieškos ir filtravimo palaikymu
- Produkto redagavimas: Palaikykite produkto informacijos modifikavimą
- Produkto ištrynimas: Palaikykite produkto ištrynimą (su patvirtinimo raginimu)
- Atsargų valdymas
- Įeinančios operacijosPadidinkite produktų atsargų kiekį, registruokite atvežimo laiką ir kiekį
- Išvykstamosios operacijosSumažinkite produktų atsargų kiekį, užfiksuokite išsiuntimo laiką ir kiekį
- Inventoriaus įrašai: Rodo kiekvieno produkto atsargų pakeitimų istoriją
- Sąsajos funkcijos
- Prietaisų skydelis: Rodo statistiką, pvz., bendrą produktų skaičių, bendrą atsargų vertę, įspėjimus apie mažą atsargų likutį ir kt.
- Reaguojantis dizainasPritaikoma prie stalinių ir mobiliųjų įrenginių
- Duomenų išsaugojimasNaudoja vietinę saugyklą duomenims išsaugoti
Techniniai reikalavimai
Stiliai ir piktogramos
- CSS sistemaNaudoja „TailwindCSS 3.0+“ CDN
- Piktogramų bibliotekaNaudoja herojų arba plunksnų piktogramas CDN
- ŠriftasNaudokite „Google“ šriftus
Kodo struktūra
- Vieno puslapio paraiškaHTML + CSS + JavaScript
- Modulinis dizainas: Suskirstykite funkcijas į skirtingus „JavaScript“ modulius
- Duomenų formatas: Produkto duomenims saugoti naudokite JSON formatą
Sąsajos projektavimo reikalavimai
- Modernus vartotojo sąsajosPaprastas ir gražus sąsajos dizainas
- Spalvų schemaNaudokite profesionalius verslo spalvų derinius
- Interaktyvus atsiliepimasMygtukų paspaudimai, formos patvirtinimas ir kiti interaktyvūs efektai
- Formos patvirtinimasPrivalomas lauko patvirtinimas, duomenų formato patvirtinimas
Duomenų struktūros pavyzdys
Prašome sugeneruoti visą HTML failą, kuriame būtų visas reikalingas CSS ir „JavaScript“ kodas, užtikrinant, kad visos funkcijos veiktų ir galėtų būti tiesiogiai paleistos naršyklėje.
Pažvelkime į testo rezultatus. Logika iš tikrųjų yra gana sudėtinga, ji tikrina modelio konteksto ilgį, estetinį pojūtį ir loginio apdorojimo galimybes.
Šiuo atveju visi modeliai, išskyrus „Deepseek“, nepavyko. Claude'o 4 vertimas buvo visai neadekvatus, jei atvirai.
„Deepseek-R1-0528“: Atnaujinta R1 versija yra labai galinga. Kaip matote, sąsaja yra labai profesionali, taip pat galite kurti naujus produktus, atlikti įprastas siuntimo ir įėjimo operacijas, suskirstyti produktų, atsargų valdymo ir atsargų ataskaitas į tris puslapius, o tai apskritai labai aišku. Taip pat yra specialus prietaisų skydelio puslapis, ir jis parašė keletą pavyzdinių duomenų testavimui. Kiti modeliai neturi duomenų, o produktų pridėjimas neveikia, todėl testavimas yra visiškai neįmanomas.
Claude'o opusas 4: Pradžioje naudojama didelė, labai paprasta sąsaja, naudojant viršutinę naršymo juostą, o ne šoninę juostą, įprastą SaaS platformose. Pridėjus produktus, išsaugant įvyksta klaida, todėl testavimas tampa neįmanomas.
Klodo sonetas 4: Palyginti su „Opus 4“, sąsaja yra dar paprastesnė. Paspaudus mygtuką „Pridėti produktą“, niekas nereaguoja ir neatsiranda joks iššokantis formos langas. Kiti puslapiai iš esmės tėra vietos rezervavimo ženklai.
Dvyniai 2.5 Pro: „Google“ versija yra geresnė nei „Claude“. Ji leidžia pridėti produktus ir tiražus, bet yra klaidų. Kai pirmą kartą bandžiau, viskas veikė, bet ne, kai įrašiau vaizdo įrašą. Tačiau „Gemini“ sąveikos dizainas yra gana sudėtingas, nes atsargų valdymas ir apskaita yra vienoje lentelėje, o tai šiek tiek apsunkina darbą.
2 bandymas: pikselių animacijos redaktorius
Toliau – vizualinių gebėjimų testas. Paprašiau jų sukurti pikselių grafikos animacijos redaktorių naudojant P5.js, palaikančią judėjimo režimus, koreguojančią taškų formas, dydžius, greičius ir kitas sąlygas.
Užduotis: Sukurkite viso ekrano interaktyvų pikselių meno animacijos generatorių, pagrįstą P5.js, kuris atitiktų šiuos techninius reikalavimus:
Pagrindinės funkcijos
- Įdiegti viso ekrano pikselių meno animaciją naudojant P5.js, apimančią visą peržiūros srities plotą.
- Bendras pikselių tinklelio plotas turi būti bent 10 kartų didesnis už matomą plotą, kad būtų užtikrintas visiškas aprėptis net ir esant mažiausiam tinklelio tarpui.
- Pateikite kelis animacijos režimus: bangų, pulso, ripple, triukšmo
- Palaikomos kelios taškų formos parinktys: apskritimas, kvadratas, kryžius, trikampis, rombas ir kt.
- Visos valdymo panelės yra dešinėje puslapio pusėje ir mobiliuosiuose įrenginiuose gali būti suskleistos iki apačios.
Reguliuojami parametrai
- Taškų tankis: valdykite taškų skaičių eilutėje / stulpelyje
- Formos dydis: koreguokite taškų dydį
- Animacijos greitis: valdykite animacijos efekto greitį ir amplitudę
- Tinklelio tarpai: reguliuokite atstumą tarp taškų
Techninės specifikacijos
- Naudokite HTML5, „TailwindCSS 3.0+“ (pristatyta per CDN) ir P5.js
- Įdiegti visišką tamsaus / šviesaus režimo perjungimo funkciją, pagal numatytuosius nustatymus naudojant sistemos nustatymus
- Kode turi būti našumo optimizavimo logika, atvaizduojanti tik matomoje srityje ir šalia kraštų esančius taškus.
- Animacijos turi veikti sklandžiai, be vėlavimų
Reaguojantis dizainas
- Puslapiai turi būti nepriekaištingai rodomi visuose įrenginiuose (mobiliuosiuose telefonuose, planšetiniuose kompiuteriuose, staliniuose kompiuteriuose)
- Valdymo skydeliai mobiliojoje versijoje turėtų būti sulankstomi / išskleidžiami
- Optimizuokite išdėstymą ir šrifto dydžius skirtingiems ekrano dydžiams
- Užtikrinkite gerą lietimo patirtį mobiliuosiuose įrenginiuose
Sąsajos elementai
- Animacijos režimo parinkiklis (banga, pulsas, pulsacija, triukšmas)
- Formos parinkiklis (rodo įvairias formas su piktogramomis)
- Slankiklių valdikliai: tankis, dydis, greitis, tarpai
- Temos perjungimo mygtukas
- Rodyti matricos perdengimo informaciją ir bendrą taškų skaičių
Pažvelkite į rezultatus. Tiesą sakant, nesitikėjau, kad kiti modeliai šiame teste pasirodys taip prastai. Išskyrus „Deepseek-R1“, kitų modelių animacijos visiškai neveikė.
„Deepseek-R1-0528“: Visiškai nepriekaištingas. Kiekvienas mygtukas ir slankiklis veikia normaliai, o taškai juda sklandžiai. Netgi pridėti taškinės matricos duomenys, o spalvos išlieka pastovios perjungus į naktinį režimą. Vienintelė nedidelė problema yra ta, kad pasirinkta spalvų pasirinkimo būsena turi nedidelę problemą, tačiau ji yra nereikšminga, palyginti su katastrofišku kitų modelių našumu.
Claude'o opusas 4: Geros naujienos: jame yra pikselių iliustracijų. Blogos naujienos: jis nejuda. Dešinėje pusėje esantį turinį galima valdyti įprastai, bet perjungus į naktinį režimą spalvų schema yra neteisinga.
Klodo sonetas 4: Šis variantas – visiška katastrofa. Nėra pikselių grafikos, net nėra mygtuko pasirinkimo būsenos. Slankikliai tėra taškeliai – geriau naudoti numatytuosius komponentus.
Dvyniai 2.5 Pro: Taip pat praneša apie klaidą be pikselių tinklelio. Dešinėje pusėje esantį turinį galima valdyti įprastai, o temų perjungimas veikia gerai, tačiau numatytieji komponentai yra šiek tiek negražūs.
3 bandymas: vaizdo gradiento spalvų išgavimo įrankis
Tai įrankis, apie kurį rašiau anksčiau. Logikos aprašymo nėra daug, bet stilius aprašytas plačiau. Pagrindinė funkcija – iš paveikslėlio išskirti penkis gradiento spalvų rinkinius.
Užduotis: sugeneruoti HTML tinklalapį pagal toliau pateiktą failo turinį, palaikyti penkių gradiento spalvų rinkinių išgavimą iš įkeltų vaizdų ir leisti vartotojams tiesiogiai nukopijuoti penkis šešioliktainių gradiento spalvų rinkinius. Reikia įdiegti spalvų išgavimo funkciją.
- Naudokite „NetEase Cloud Music“ stiliaus vizualinį dizainą, baltą foną su spalva, panašia į #FE1110, kaip akcentą.
- Pabrėžkite didelius šriftus arba skaičius, kad paryškintumėte pagrindinius dalykus. Įtraukite didelius vaizdinius elementus, kad pabrėžtumėte svarbias sritis ir sukurtumėte kontrastą su mažesniais elementais.
- Derinkite kinų ir anglų kalbos tekstus. Naudokite paryškintus, didelius kinų rašmenis ir mažesnį anglišką tekstą kaip akcentus.
- Duomenų vizualizavimui arba kaip dekoratyvinius elementus naudokite paprastą linijinę grafiką.
- Norėdami sukurti technologiškai įkvėptą efektą, naudokite paryškinimo spalvų skaidrumo gradientą, tačiau įsitikinkite, kad skirtingos paryškinimo spalvos nesimaišo viena su kita.
- Atkartokite oficialios „Apple“ svetainės animacijas, o slenkant pele suaktyvinamos animacijos
- Duomenims galima remtis internetiniuose diagramų komponentuose, o stiliai atitinka temą.
- Naudokite „Framer Motion“ (per CDN)
- Naudokite HTML5, „TailwindCSS 3.0+“ (per CDN) ir reikiamą „JavaScript“
- Naudokite profesionalias piktogramų bibliotekas, tokias kaip „Font Awesome“ arba „Material Icons“ (per CDN)
- Venkite naudoti jaustukus kaip pagrindines piktogramas
- Apatiniame kairiajame kampe esantis kapsulės mygtukas rodo autoriaus „Twitter“ vartotojo vardą.
Šiuo atveju Claude'as pagaliau atliko puikų darbą. „Deepseek-R1-0528“ puslapio detalės ir estetika įspūdingi, tačiau funkcionalumas nėra įgyvendintas. „Opus 4“ ir „Sonnet 4“ puslapiai paprastesni, bet bent jau funkcionalūs, o „Gemini“ visiškai neveikia.
„Deepseek-R1-0528“: Dar kartą panaudojus mano užklausą, „Deepseek“ puslapio estetika yra tikrai neprilygstama. Jis taip pat pridėjo daug SEO optimizuoto turinio, pavyzdžiui, programų scenarijus ir apdorojimo laiką. Gradiento spalvų rodymo kortelės taip pat yra labai detalios, tačiau spalvų pasirinkimo logika nėra įdiegta.
Claude'o opusas 4: Šį kartą Claude'as pagaliau nenuvylė, užbaigdamas puslapio funkcionalumą, tačiau puslapio turinys labai paprastas, yra tik vieta įkelti paveikslėlius ir rezultatus, o spalvų pasirinkimo logika taip pat prasta. Tačiau bent jau veikia.
Klodo sonetas 4: „Sonnet 4“ taip pat užbaigė funkcionalumą, ir aš netgi manau, kad „Sonnet“ rezultatai yra geresni nei „Opus“, nors jis vis tiek nėra toks turtingas kaip „Deepseek“.
Dvyniai 2.5 Pro: Šis yra blogiausias. Ne tik trūksta puslapio detalių ir estetikos, bet ir funkcionalumas nėra įdiegtas, o programa užstringa paleidžiant.
4 testas: „White Noise“ dienos citatų svetainė
Toliau pateikiamas baltojo triukšmo kasdienių citatų svetainės generatorius, puikiai tinkantis naujo skirtuko puslapio įskiepiui. Jis palaiko baltojo triukšmo grojimą iš „Spotify“, o tinklalapis rodomas
Užduotis: Prašau padėti man sukurti paprastą ir elegantišką dienos citatų svetainę, atitinkančią šiuos reikalavimus:
Vizualinis dizainas
- Fono paveikslėlis: Atsitiktinai pasirinkite aukštos kokybės kraštovaizdžio vaizdus iš šių nuorodų kaip fono paveikslėlį
- Vaizdo nuorodosXXXX
- Vaizdų apdorojimasPridėkite 25% juodą kaukę ir šiek tiek Gauso suliejimo, kad tekstas išliktų aiškus ir įskaitomas.
- Bendras stiliusMinimalistinis ir modernus, su horizontaliais tinklalapio vaizdais kaip fonu, kad būtų dar labiau įsitraukęs
- Animacijos sistemai naudokite anime.js (pristatyta per CDN: JsDelivr jsdelivr.com), HTML5, TailwindCSS 3.0+ (pristatyta per CDN) ir reikiamą JavaScript, taip pat naudokite profesionalias piktogramų bibliotekas, tokias kaip „Font Awesome“ arba „Material Icons“ (pristatyta per CDN).
Laiko rodymo modulis
- Viršuje: Rodyti mėnesio ir dienos formatą (pvz., „gegužės 29 d.“) mažesniu šriftu, centre
- Antra eilė: Rodo formatą „X savaitė · Mėnulio kalendorius X mėnuo X diena“ mažesniu šriftu
- Centras: Dideliu baltu šriftu, centre, paryškina dabartinę datą
Citatos rodymo modulis
- TurinysAtsitiktinai rodomos klasikinės kinų ir užsienio filosofų bei rašytojų citatos
- IšdėstymasCitatos centruotos, šrifto dydis vidutinis, o eilučių tarpai patogūs.
- PriskyrimasApatiniame dešiniajame kampe rodomas užrašas „Rašytojas, XXX“ arba „Filosofas, XXX“
- Citatų biblioteka: Pateikiamos citatos įvairiomis temomis, tokiomis kaip motyvacija, gyvenimo įžvalgos ir išmintis
Muzikos atkūrimo funkcija
- VietaApatiniame kairiajame puslapio kampe, pagal numatytuosius nustatymus sutrauktame
- TurinysĮterpti „Spotify“ baltojo triukšmo grojaraštį
- Kodas:
Techninis įgyvendinimas
- Reaguojantis dizainasPritaikyta stacionariems ir mobiliesiems įrenginiams
- Šrifto pasirinkimasNaudokite elegantiškus kinų šriftus, kuriuos pristatė „Google Fonts“
- Spalvų schema: Daugiausia naudokite baltą tekstą, kad būtų galima įskaityti visuose fonuose
- Optimizavimo įkėlimas: Vėlyvas vaizdų įkėlimas siekiant pagerinti puslapio našumą
Interaktyvios funkcijos
- Automatinis atnaujinimas: Automatiškai keičia fono paveikslėlį ir citatą kiekvieną dieną
- Rankinis atnaujinimas: Pateikia atnaujinimo mygtuką, kad vartotojai galėtų rankiniu būdu keisti turinį
Reklaminių tekstų rašymo stilius
- Citatos pasirinkimasPirmenybę teikite trumpoms, teigiamoms ir filosofinėms citatoms
- Kalbos stiliusGlaustas ir galingas, vengiant per ilgo teksto.
- Temų klasifikacijaGyvenimo įžvalgos, įkvepiantis augimas, išmintingos mintys, emocinė raiška ir kt.
Prašome sugeneruoti pilną HTML/CSS/JavaScript svetainę pagal aukščiau pateiktus reikalavimus, užtikrinant, kad sąsaja būtų estetiškai patraukli, funkcionali ir suteiktų gerą naudotojo patirtį.
Šis testas skirtas tik įvertinti kiekvieno modelio estetikos supratimą. Šio tipo į rodymą orientuotas tinklalapis paprastai yra įmanomas.
Reikia pasakyti, kad „Claude Opus 4“ šioje srityje vis dar yra gana autoritetingas, pasižymintis puikiu dėmesiu detalėms. „Gemini 2.5 Pro“ taip pat yra geras, netgi prideda animacijos efektus vaizdų perėjimams. „Deepseek“ ir „Sonnet 4“ yra tame pačiame lygyje.
„Deepseek-R1-0528“: Pirmiausia paleidau „Deepseek“ ir manau, kad jis jau gana neblogas. Pirmoji problema, susijusi su bendra estetika, buvo muzikos mygtukas apatiniame kairiajame kampe, kuris buvo kiek per plokščias. Citatų skiltyje taip pat buvo problemų – juodos kaukės neturėjo būti pridėta, o teksto lygiavimas buvo šiek tiek netikslus. Tačiau atnaujinimui buvo pridėtas animacijos efektas.
Claude'o opusas 4: „Opus 4“ estetika išties nepriekaištinga. Visų šriftų dydis ir tarpai yra labai patogūs, o garsių posakių citatos yra skaidrios tiek citatos tekste, tiek kabutėse. Net „Spotify“ grotuvas buvo aptrauktas vartotojo sąsaja su išskleidimo / suskleidimo animacija. Tai tobula.
Klodo sonetas 4: „Sonnet 4“ efektas panašus į „Deepseek“ problemą. Galima dar labiau optimizuoti muzikos grojimo mygtuką, teksto dydį, lygiavimą ir tarpus.
Dvyniai 2.5 Pro: „Gemini“ efektas taip pat geras, bet teksto šešėlio pašalinimas būtų geresnis. Taip pat pritaikyta „Spotify“ grotuvo sąsaja, teksto detalės yra geros. Perėjimo efektas pastebimas, vaizdas tempiamas.
5 bandymas: miego programėlės puslapio generavimas
Toliau – mobiliosios programėlės testavimas. Paprašykite kiekvieno iš jų sukurti miego stebėjimo programėlę. Užduotyje bus nurodytas techninis paketas ir dizaino reikalavimai, taip pat reikės sugeneruoti kelis interaktyvius puslapius.
Klausimas: Miego stebėjimo programėlės kūrimo reikalavimai
Projekto apžvalga
Prašau padėti man sukurti išsamią miego stebėjimo programėlę su keturiais pagrindiniais funkciniais puslapiais. Sąsaja turėtų būti estetiškai patraukli ir profesionali.
Techniniai reikalavimai
Priekinės dalies technologijos
– HTML5 – Puslapio struktūra
– „TailwindCSS“ 3.0+ versija – Stiliaus sistema (pristatyta per CDN)
– JavaScript – Būtina sąveikos logika
– Anime.js v4.0.2 – Animacijos efektų biblioteka
- CDN:
https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm
Piktogramos ir diagramos
- Piktogramų biblioteka: „Font Awesome“ arba „Material Icons“ (CDN)
- Diagramos komponentai: internetinės diagramos komponentai ir stiliai turi atitikti temą
- Duomenų vizualizavimas: Palaiko miego duomenų diagramų rodymą
Projektavimo reikalavimai
Reaguojantis dizainas
- Visiškai reaguojantis išdėstymas
- Mobiliesiems įrenginiams pritaikytas dizainas
- Geras vaizdas tiek staliniuose, tiek mobiliuosiuose įrenginiuose
Sąveikos poveikis
- Mygtuko sąveika: šiek tiek padidintas efektas užvedus pelės žymeklį
Formos sąveika: Rodyti gradiento kraštinę, kai įvesties laukas yra sufokusuotas
Kortos sąveika: Užveskite pelės žymeklį ir patamsinkite šešėlį.
Animacijos efektai: naudokite „Anime.js“, kad sukurtumėte sklandžius puslapio animacijos efektus.
Funkcinio puslapio reikalavimai
Prašome sugeneruoti visus miego stebėjimo programėlei reikalingus puslapius, įskaitant, bet neapsiribojant:
- Pagrindinis puslapis / prietaisų skydelis
- Miego įrašų puslapis
- Duomenų analizės puslapis
- Nustatymų puslapis
- Kiti susiję funkciniai puslapiai
Kodo išvesties reikalavimai
- Kiekvienas puslapis yra nepriklausomas HTML failas
- Aiški kodo struktūra su išsamiais komentarais
- Įsitikinkite, kad visos CDN nuorodos yra prieinamos
- Pateikite pilną, paleidžiamą kodą
Kalbant apie mobiliąją logiką ir sąsają, „Cluade Opus 4“ dar kartą pademonstravo savo galią, atlikdamas kelis puslapius su gera logika. Kiti modeliai sugeneravo tik vieną puslapį, tačiau „Deepseek R1 0528“ netikėtai pataikė į dešimtuką estetikos ir gražaus stiliaus prasme. Nors sugeneravo tik vieną puslapį, jis buvo labai išbaigtas.
„Deepseek-R1-0528“: Sugeneruotas tik vienas puslapis, bet bendra estetika gera. Kortelių detalės ir piktogramų valdymas yra gerai atlikti, visas puslapis yra išsamus ir ilgas. Be to, navigacijai buvo įdiegtas reaguojantis dizainas, todėl mobiliuosiuose ir staliniuose įrenginiuose išdėstymai yra visiškai skirtingi.
Claude'o opusas 4: Išties galingas, tik „Opus4“ sugeneravo visus puslapius pilnai, bet estetinis dizainas šį kartą nėra puikus, naudojama tinklalapio logika, o naršymo piktogramos per mažos.
Klodo sonetas 4: Sugeneruotas tik vienas puslapis ir pranešta apie klaidas, prastas estetinis dizainas, tiesiog atlikta užduotis.
Dvyniai 2.5 Pro: „Google“ visada viską daro skirtingai. Ji generuoja kiekvieną puslapį atskirai, pateikdama keturis failus, kurie negali sąveikauti tarpusavyje. Be to, visuose puslapiuose buvo pranešta apie klaidas, kiekviename puslapyje buvo tik navigacija ir jokio turinio, o tai gana nuvilia.
6 testas: sudėtingas funkcionalumas – Tetris
Galiausiai atlikau nedidelį žaidimo testą. Sukūriau gana sudėtingą „Tetris“ žaidimą su specialiais blokais, temų perjungimu, blokų nukreipimo numatymu, blokų saugojimu ir kita – tikras iššūkis.
Užduotis: Prašau padėti man sukurti pilnai veikiantį, vizualiai patrauklų „Tetris“ internetinį žaidimą, atitinkantį šiuos reikalavimus:
Pagrindinės žaidimo funkcijos
- Pilnas Tetris mechanizmas7 standartiniai blokai (I, O, T, S, Z, J, L)
- Sklandus valdymas: judėjimas į kairę ir į dešinę, sukimasis, greitas kritimas, momentinis kritimas
- Išmanioji pašalinimo sistema: palaiko 1–4 eilučių pašalinimą vienu metu naudojant specialius animacijos efektus
- Progresyvi sunkumo sistema: automatiškai padidina kritimo greitį ir lygį pagal pašalintų eilučių skaičių
Išplėstinės funkcijos
- Peržiūros sistema: rodo kitą ir kitą-kitą blokus
- Laikymo funkcija: Laikykite nuspaudę klavišą „Hold“, kad laikinai išsaugotumėte dabartinį bloką. Galima naudoti tik vieną kartą per raundą.
- Vaiduoklių blokai: Rodo blokų nusileidimo vietą pusiau permatoma forma
- Kombinuota sistemaNuolatinis valymas suteikia papildomų taškų ir vaizdinių efektų.
- Specialūs įgūdžiai:
- Bombų blokas (išvalo aplinkinę teritoriją)
- Lazerinis valymas (išvalo visą eilę)
- Laiko pauzė (blokeliai nustoja kristi 3 sekundėms)
Vizualinio dizaino reikalavimai
- Moderni vartotojo sąsaja:
- Gradiento fonas arba dalelių efektai
- Stiklo efekto žaidimo skydelis
- Sklandūs animacijos perėjimai
- Prisitaikantis dizainas skirtingiems ekranams
- Sodrūs vaizdo efektai:
- Sklandžiai krentančių ir besisukančių blokų animacija
- Sprogimo ar blyksnio efektai, kai jie pašalinami
- Ekrano drebėjimo efektas, kai pasiekiamas derinys
- Šventės animacija, kai lygis atnaujinamas
- Temų sistemaBent 3 skirtingos vaizdinės temos, tarp kurių galima perjungti
Garso efektų sistema
- Visiškas garso grįžtamasis ryšys: judėjimas, sukimasis, nusileidimas, eliminavimas, žaidimo pabaiga ir kt.
- Fono muzika: ciklinis žaidimo fonas
- Garsumo valdymasnepriklausomai reguliuojami garso efektai ir foninės muzikos garsumas
Žaidimo režimai
- Klasikinis režimasTradicinis „Tetris“ žaidimo būdas
- Laiko apribojimo režimas: pasiekti aukščiausią balą per nustatytą laiką
- Iššūkio režimasiš anksto nustatytos kliūtys, siekiant padidinti sunkumą
- Zen režimasjokio laiko spaudimo, grynas žaidimo malonumas
Duomenų statistikos funkcijos
- Realaus laiko statistika: dabartinis rezultatas, lygis, įveiktų linijų skaičius, žaidimo laikas
- Istorija: aukščiausias balas, geriausias lygis, bendras žaidimo laikas
- Pasiekimų sistema: atrakinti įvairius žaidimo pasiekimus
- Vietinė saugykla: išsaugoti žaidimo įrašus ir nustatymus
Techniniai reikalavimai
- Naudoja gryną HTML5/CSS3/JavaScript, nereikia jokių išorinių sistemų
- Aiški kodo struktūra: objektinis programavimas, modulinis dizainas
- Našumo optimizavimasSklandi 60 kadrų per sekundę animacija, be vėlavimo
- Suderinamumas: palaiko pagrindines šiuolaikines naršykles
- Reaguojantis dizainasSuderinamas su kompiuteriais ir mobiliaisiais įrenginiais
Vartotojo patirtis
- Intuityvios instrukcijosIntegruotas vadovėlis ir mygtukų raginimai
- Pauzės / tęsimo funkcija: Bet kuriuo metu pristabdykite žaidimą
- Nustatymų meniu: Reguliuokite žaidimo sunkumą, garso efektus, vaizdo efektus ir kt.
- Žaidimo būsenos išsaugojimas: Palaiko žaidimo išsaugojimą ir atnaujinimą
Kodo kokybės reikalavimai
- Išsamūs komentaraiKiekviena funkcija ir svarbus kodo segmentas turi turėti aprašymą
- Klaidų tvarkymasIšsamus išimčių fiksavimo ir tvarkymo mechanizmas
- Elegantiškas kodasLaikytis geriausios praktikos, lengvai suprantama ir prižiūrima
- Išplečiamumas: Ateityje bus lengva pridėti naujų funkcijų
Pateikite išsamius HTML failus su visu CSS ir „JavaScript“ kodu, kad juos būtų galima paleisti tiesiai naršyklėje. Kodas turėtų parodyti profesionalius programavimo įgūdžius ir gilų žaidimų kūrimo supratimą.
Mini žaidime Claude'as kažką daro. Tiek Opus, tiek Sonnet sugeneravo atitinkamus Tetris blokus, kaip reikalaujama, ypač specialiųjų blokų logiką. „Deepseek“ tvarkė temą, kurios Claude'as nepastebėjo, bet praleido specialiuosius blokus, todėl „Gemini 2.5 Pro“ sugeneravo nežaidžiamus blokus.
„Deepseek-R1-0528“: Užduotis atlikta labai gerai ir pagal specifikacijas, tačiau specialus blokų dizainas buvo praleistas ir visai neįdiegtas. Tai galėjo būti dėl problemų, susijusių su raginimų žodžių sekimu. Visas tinklalapis primena žaidimo sąsają, o visi mygtukai atrodo kaip standartiniai komponentai.
Claude'o opusas 4: Specialiųjų blokų ir kitos logikos logika baigta be problemų, bet ignoruotas raginimas keisti temą, kurio jis neįdiegė. Palyginti su DeepSeek problemomis, tai mažesnė problema, tačiau sąsaja yra užkoduota be reaguojančios logikos, todėl proporcijos yra šiek tiek iškreiptos, todėl kai kurių mygtukų negalima spustelėti.
Klodo sonetas 4: Panašus į „Opus“, bet manau, kad „Sonnet 4“ yra geresnis už „Opus“. Puslapio adaptacija taip pat gera. Jaučiasi, kad „Sonnet“ laimėjo, nes atliko visas reikiamas funkcijas.
Dvyniai 2.5 Pro: Dvyniai nuolat sunkiai susidoroja su sudėtinga logika. Šį kartą tai buvo visiškai neįmanoma, nes plytų išdėstymo klaida neleido numatyti, kur jie nusileis. Tai blogiausia.
Manau, kad dabar DeepSeek-R1 našumas jus stebina taip pat, kaip ir mane.
Sunku patikėti, kad tai tik mažas modelio atnaujinimas. Palyginkime šių modelių kainas su DeepSeek R1 0528.
„Opus 4“ yra 30 kartų brangesnis, ir tai naudojant „Openrouter“ kainodarą – oficiali kaina būtų dar stulbinamesnė.
modelis | Konteksto ilgis | Įvesties kaina ($/M žetonai) | Produkcijos kaina ($/M žetonų) | vaizdo kaina ($/K žetonų) |
DeepSeek R1 0528 | 160 tūkst. | 0.50 | 2.18 | – |
„Gemini 2.5 Pro“ apžvalga | 1000 tūkst. | 1.25 | 10 | 5.16 |
Claude'as Sonnetas 4 | 200 tūkst. | 3.00 | 15 | 4.80 |
Claude'o Opus 4 | 200 tūkst. | 15.00 | 75 | 24.00 |
Kaip žmogus, kasdien susiduriantis su dirbtinio intelekto naujienomis, mačiau daugybę „proveržių“, kurie galiausiai pasirodė esą „nuviliantys“. Tačiau šį kartą yra kitaip. DeepSeek-R1 suteikė man tikros vilties.
Kainos skirtumas 30 kartų, tačiau našumas beveik toks pat.
Mums nebereikia mokėti pernelyg didelių kainų, kad galėtume naudoti geriausius dirbtinio intelekto programavimo modelius, taip pat nereikia daryti skausmingų kompromisų tarp kainos ir kokybės. Dar labiau įkvepia tai, kad tai yra mūsų pačių modelis.
Šį sakinį parašė DI ir manau, kad jis puikus: Tikroji revoliucija dažnai prasideda tada, kai paprasti žmonės gali pasiekti žvaigždes.