Oor die afgelope paar dae is Deepseek-R1 0528 amptelik oopbron beskikbaar gestel.
Op LiveCodeBench is die werkverrigting amper gelykstaande aan OpenAI se o3 (hoog); in Aider se veeltalige maatstaftoets staan dit sy eie teen Claude Opus.
Toe dit op die amptelike webwerf bekendgestel is, het ons vinnig die voorkantvermoëns daarvan getoets en gevind dat dit buitengewoon sterk is, wat gelei het tot die toetse wat in hierdie artikel behandel word. Ons doel is om die spesifieke werkverrigting van verskillende modelle met jou te deel.
Dit is belangrik om daarop te let dat hierdie toets hoofsaaklik op voorkantvermoëns fokus, daarom is dit noodsaaklik om die werkverrigting van verskillende modelle objektief te beskou. Jy kan die aanwysings wat ons verskaf gebruik om jou eie toetse uit te voer en jou insigte en bevindinge te deel.
Met dieselfde aanwysingsboodskap het ons dit na Claude Opus 4, Sonnet 4, Gemini 2.5 Pro gestuur, en DeepSeek R1-0528, en het hulle laat meeding in ses toenemend uitdagende front-end ontwikkelingstake.
Vir diegene wat nie kan wag nie, hier is die gevolgtrekking:
Deepseek-R1-0528 is effens laer as Opus 4 in front-end vermoëns, maar presteer beter. Sonnet 4 en Gemini 2.5 Pro.
Basies, enige taak wat Opus kan voltooi, kan R1 ook voltooi, en selfs take wat Opus 4 nie kan voltooi nie, kan R1 hanteer, alhoewel met effens laer voltooiingsyfers en resultaatkwaliteit.
In die lig van die prysverskil tussen R1 en die ander drie, is hierdie prestasie reeds uitstekend, en ons kan ons net voorstel hoe indrukwekkend R2 sal wees.
Toets 1: Pakhuisbestuurstelsel
Vra: Help my asseblief om 'n volledige webgebaseerde produkbestuurshulpmiddel te skep met die volgende vereistes:
Funksionele Vereistes
- Produkbestuur
- ProdukinligtinginvoerProduknaam, tipe/kategorie, SKU-nommer, prys, voorraadhoeveelheid
- ProdukbeeldbestuurOndersteun beeldoplaai en voorskou (gesimuleer met 'n lêerselektor)
- ProduklysvertoningVertoon alle produkte in 'n tabelformaat, met soek- en filterondersteuning
- ProdukredigeringOndersteun produkinligtingwysiging
- ProdukverwyderingOndersteun produkverwydering (met bevestigingsprompt)
- Voorraadbestuur
- Inkomende bedrywighedeVerhoog produkvoorraadhoeveelheid, teken inkomende tyd en hoeveelheid aan
- Uitgaande bedrywighedeVerminder produkvoorraadhoeveelheid, teken uitgaande tyd en hoeveelheid aan
- VoorraadrekordsVertoon die voorraadveranderingsgeskiedenis vir elke produk
- Koppelvlakkenmerke
- DashboardVertoon statistieke soos totale aantal produkte, totale voorraadwaarde, waarskuwings oor lae voorraad, ens.
- Responsiewe ontwerpAanpasbaar vir rekenaar- en mobiele toestelle
- Data-persistensieGebruik plaaslike berging om data te stoor
Tegniese vereistes
Style en ikone
- CSS-raamwerkGebruik TailwindCSS 3.0+ CDN
- IkoonbiblioteekGebruik Heroicons of Veerikone CDN
- LettertipeGebruik Google-lettertipes
Kodestruktuur
- Enkelbladsy-aansoekHTML + CSS + JavaScript
- Modulêre ontwerpVerdeel funksies in verskillende JavaScript-modules
- DataformaatGebruik JSON-formaat om produkdata te stoor
Vereistes vir koppelvlakontwerp
- Moderne gebruikerskoppelvlakEenvoudige en pragtige koppelvlakontwerp
- KleurskemaGebruik professionele sakekleurkombinasies
- Interaktiewe terugvoerKnoppieklikke, vormvalidering en ander interaktiewe effekte
- VormvalideringVereiste veldvalidering, dataformaatvalidering
Voorbeeld van datastruktuur
Genereer asseblief 'n volledige HTML-lêer wat al die nodige CSS- en JavaScript-kode bevat, en verseker dat alle funksies funksioneel is en direk in 'n blaaier kan loop.
Kom ons kyk na die toetsresultate. Die logika is eintlik nogal kompleks en toets die model se kontekslengte, estetiese sin en logiese verwerkingsvermoëns.
In hierdie geval het alle modelle behalwe Deepseek misluk. Claude 4 se vertaling was nogal af, om eerlik te wees.
Deepseek-R1-0528: Die opgegradeerde weergawe van R1 is baie kragtig. Soos jy kan sien, is die koppelvlak baie professioneel, en jy kan ook nuwe produkte skep, normale uitgaande en inkomende bedrywighede uitvoer, en produk-, voorraadbestuur- en voorraadverslae in drie bladsye verdeel, wat oor die algemeen baie duidelik is. Daar is ook 'n toegewyde dashboard-bladsy, en hy het 'n paar voorbeelddata vir toetsing geskryf. Die ander modelle het geen data nie, en die byvoeging van produkte werk nie, so toetsing is heeltemal onmoontlik.
Claude Opus 4: Dit begin met 'n groot koppelvlak, baie eenvoudig, met 'n boonste navigasiebalk in plaas van die sybalk wat algemeen in SaaS-platforms is. Die byvoeg van produkte lei tot 'n fout tydens stoor, wat toetsing onmoontlik maak.
Claude Sonnet 4: In vergelyking met Opus 4, is die koppelvlak selfs meer basies. As jy op die "Voeg Produk by"-knoppie klik, reageer dit nie, en geen vorm-opspringvenster verskyn nie. Die ander bladsye is in wese net plekhouers.
Gemini 2.5 Pro: Google se weergawe is beter as Claude s'n. Dit laat die byvoeging van produkte en lopies toe, maar daar is foute. Dit het gewerk toe ek dit die eerste keer probeer het, maar nie toe ek 'n video opgeneem het nie. Gemini se interaksie-ontwerp is egter nogal kompleks, met voorraadbestuur en rekordhouding alles in een tabel, wat 'n bietjie probleme veroorsaak.
Toets 2: Piksel-animasieredigeerder
Volgende is 'n toets van visuele vermoë. Ek het hulle gevra om 'n pixelkuns-animasieredigeerder te skep met behulp van P5.js, wat bewegingsmodusse ondersteun, puntvorms, groottes, snelhede en ander voorwaardes aanpas.
Aanwysing: Skep 'n volskerm interaktiewe pixelkuns-animasiegenerator gebaseer op P5.js, wat aan die volgende tegniese vereistes voldoen:
Kernkenmerke
- Implementeer volskerm-pikselkunsanimasie met behulp van P5.js, met die animasie wat die hele kykvensterarea dek.
- Die totale oppervlakte van die pixelrooster moet ten minste 10 keer die sigbare oppervlakte wees om volle dekking te verseker, selfs met die kleinste roosterafstand.
- Verskaf verskeie animasiemodusse: Golf, Pols, Rimpeling, Geraas
- Ondersteun verskeie puntvormopsies: sirkel, vierkant, kruis, driehoek, diamant, ens.
- Alle beheerpanele is aan die regterkant van die bladsy geplaas en kan op mobiele toestelle tot onder ineengevou word.
Verstelbare Parameters
- Puntdigtheid: Beheer die aantal punte per ry/kolom
- Vormgrootte: Pas die grootte van die kolletjies aan
- Animasiespoed: Beheer die spoed en amplitude van die animasie-effek
- Roosterafstand: Pas die afstand tussen kolletjies aan
Tegniese Spesifikasies
- Gebruik HTML5, TailwindCSS 3.0+ (bekendgestel via CDN), en P5.js
- Implementeer volle donker/lig modus skakelfunksionaliteit, met standaard stelselinstellings
- Kode moet prestasie-optimaliseringslogika insluit, wat slegs punte binne die sigbare area en naby die rande weergee
- Animasies moet glad verloop sonder vertraging
Responsiewe ontwerp
- Bladsye moet perfek op alle toestelle (mobiel, tablet, rekenaar) vertoon
- Beheerpanele moet in mobiele aansig invoubaar/uitbreibaar wees
- Optimaliseer uitleg en lettergroottes vir verskillende skermgroottes
- Verseker 'n goeie aanraakervaring op mobiele toestelle
Koppelvlak-elemente
- Animasiemodusseleksie (golf, puls, rimpeling, geraas)
- Vormselektor (vertoon verskeie vorms met ikone)
- Skuifbalkkontroles: digtheid, grootte, spoed, spasiëring
- Tema-skakelaarknoppie
- Wys matriksoorleginligting en totale aantal punte
Kyk na die resultate. Om eerlik te wees, ek het nie verwag dat die ander modelle so swak in hierdie toets sou presteer nie. Behalwe vir Deepseek-R1, het die animasies van die ander modelle glad nie gewerk nie.
Deepseek-R1-0528: Perfek foutloos. Elke knoppie en skuifbalk funksioneer normaal, en die punte beweeg glad. Dit het selfs puntmatriksdata bygevoeg, en die kleure bly konsekwent nadat daar na nagmodus oorgeskakel is. Die enigste klein probleempie is dat die gekose status van die kleurkeuse 'n effense probleem het, maar dit is weglaatbaar in vergelyking met die rampspoedige prestasie van die ander modelle.
Claude Opus 4: Goeie nuus: dit het pixelkuns. Slegte nuus: dit beweeg nie. Die inhoud aan die regterkant kan normaalweg gebruik word, maar die kleurskema is verkeerd nadat daar na nagmodus oorgeskakel is.
Claude Sonnet 4: Hierdie een is 'n ramp. Daar is geen pixelkuns nie, en selfs die knoppie-seleksiestatus ontbreek. Die skuifbalkies is net kolletjies – jy kan net sowel die standaardkomponente gebruik.
Gemini 2.5 Pro: Rapporteer ook 'n fout sonder 'n pixelrooster. Die inhoud aan die regterkant kan normaalweg bedryf word, en temawisseling werk goed, maar die standaardkomponente is 'n bietjie lelik.
Toets 3: Beeldgradiëntkleur-ekstraksie-instrument
Hierdie is 'n hulpmiddel wat ek vroeër geskryf het. Daar is nie veel beskrywing van die logika nie, maar daar is meer beskrywing van die styl. Die hooffunksie is om vyf stelle gradiëntkleure uit 'n beeld te onttrek.
Aanwysing: Genereer 'n HTML-webblad gebaseer op die volgende lêerinhoud, ondersteun die onttrekking van vyf stelle gradiëntkleure uit opgelaaide beelde, en laat gebruikers toe om die vyf stelle heksadesimale gradiëntkleure direk te kopieer. Die kleuronttrekkingsfunksie moet geïmplementeer word.
- Gebruik NetEase Cloud Music-styl visuele ontwerp, wit agtergrond met 'n kleur soortgelyk aan #FE1110 as die hoogtepunt
- Beklemtoon groot lettertipes of syfers om sleutelpunte uit te lig. Sluit oorgroot visuele elemente in om fokusareas te beklemtoon en skep kontras met kleiner elemente.
- Meng Chinese en Engelse teks. Gebruik vetgedrukte, groot Chinese karakters en kleiner Engelse teks as aksente.
- Gebruik eenvoudige lyngetekende grafika vir datavisualisering of as dekoratiewe elemente.
- Gebruik die deursigtigheidsgradiënt van hoogtepuntkleure om 'n tegnologies-geïnspireerde effek te skep, maar maak seker dat verskillende hoogtepuntkleure nie met mekaar saamsmelt nie.
- Boots Apple se amptelike webwerf-animasies na, met muisblaai wat animasies aktiveer
- Data kan vanaf aanlyn grafiekkomponente verwys word, met style wat ooreenstem met die tema
- Gebruik Framer Motion (via CDN)
- Gebruik HTML5, TailwindCSS 3.0+ (via CDN), en nodige JavaScript
- Gebruik professionele ikoonbiblioteke soos Font Awesome of Material Icons (via CDN)
- Vermy die gebruik van emojis as primêre ikone
- Die kapsule-knoppie in die onderste linkerhoek wys die outeur se Twitter-handvatsel
In hierdie geval het Claude uiteindelik 'n puik werk gedoen. Die bladsybesonderhede en estetika van Deepseek-R1-0528 is indrukwekkend, maar die funksionaliteit is nie geïmplementeer nie. Opus 4 en Sonnet 4 bladsye is eenvoudiger, maar ten minste funksioneel, terwyl Gemini glad nie funksioneel is nie.
Deepseek-R1-0528: Nadat ek my prompt weer gebruik het, is Deepseek se bladsy-estetika werklik ongeëwenaard. Hy het ook baie SEO-vriendelike inhoud by die bladsy gevoeg, soos toepassingscenario's en verwerkingstye. Die gradiëntkleurige vertoonkaarte is ook baie gedetailleerd, maar die kleurkeuselogika is nie geïmplementeer nie.
Claude Opus 4: Hierdie keer het Claude uiteindelik nie teleurgestel nie en die bladsyfunksionaliteit voltooi, maar die bladsyinhoud is baie basies, met slegs 'n plek om beelde en die resultate op te laai, en die kleurkeuse-logika is ook swak. Dit werk egter ten minste.
Claude Sonnet 4: Sonnet 4 het ook die funksionaliteit voltooi, en ek dink selfs Sonnet se resultate is beter as Opus s'n, alhoewel dit steeds nie so ryk soos Deepseek is nie.
Gemini 2.5 Pro: Hierdie een is die ergste. Nie net is die bladsybesonderhede en estetika kort nie, maar die funksionaliteit is ook nie geïmplementeer nie, en dit stort vas met opstart.
Toets 4: White Noise Daily Quote Webwerf
Volgende is 'n webwerf-generator vir daaglikse wit geraas-aanhalings, wat perfek is vir 'n nuwe oortjie-bladsy-inprop. Dit ondersteun die speel van wit geraas vanaf Spotify, en die webblad word vertoon.
Vra: Help my asseblief om 'n eenvoudige en elegante daaglikse kwotasiewebwerf te skep met die volgende vereistes:
Visuele Ontwerp
- AgtergrondbeeldKies lukraak hoëgehalte-landskapbeelde uit die volgende skakels as die agtergrondbeeld
- Beeldskakels: XXXX
- BeeldverwerkingVoeg 'n 25% swart masker en 'n effense Gaussiese vervaag by om te verseker dat teks duidelik en leesbaar bly.
- Algemene StylMinimalisties en modern, met landskapbeelde as die webbladagtergrond om onderdompeling te verbeter
- Gebruik anime.js (bekendgestel via CDN: JsDelivr jsdelivr.com) vir die animasieraamwerk, HTML5, TailwindCSS 3.0+ (bekendgestel via CDN), en nodige JavaScript, en gebruik professionele ikoonbiblioteke soos Font Awesome of Material Icons (bekendgestel via CDN).
Tydvertoningsmodule
- BoVertoon die maand- en dagformaat (bv. "29 Mei") in 'n kleiner lettertipe, gesentreer
- Tweede ryVertoon die formaat "Week X · Maankalender Xde maand Xde dag" in 'n kleiner lettertipe
- Sentrum: Merk die huidige datum in groot wit lettertipe, gesentreer
Kwotasie-vertoningsmodule
- InhoudVertoon lukraak klassieke aanhalings van Chinese en buitelandse filosowe en skrywers
- UitlegAanhalings is gesentreer, lettergrootte is matig en reëlafstand is gemaklik
- Toeskrywing“Skrywer, XXX” of “Filosoof, XXX” word regs onder vertoon
- AanhalingsbiblioteekBevat aanhalings oor verskeie onderwerpe soos motivering, lewensinsigte en wysheid
Musiekweergawefunksie
- LiggingOnderste linkerhoek van die bladsy, standaard ingevou
- InhoudVoeg Spotify wit geraas-speellys in
- Kode:
Tegniese Implementering
- Responsiewe OntwerpAangepas vir rekenaar- en mobiele toestelle
- LettertipekeuseGebruik elegante Chinese lettertipes, bekendgestel deur Google Fonts
- KleurskemaGebruik hoofsaaklik wit teks om leesbaarheid op alle agtergronde te verseker
- Laai-optimaliseringLui laai van beelde om bladsyprestasie te verbeter
Interaktiewe kenmerke
- Outomatiese HerlaaiVerander outomaties die agtergrondbeeld en aanhaling elke dag
- Handmatige VerversingVerskaf 'n verversingsknoppie waarmee gebruikers die inhoud handmatig kan verander
Kopieskryfstyl
- AanhalingskeuseVerkies kort, positiewe en filosofiese aanhalings
- TaalstylBondig en kragtig, vermy oormatige lengte
- Tema KlassifikasieLewensinsigte, inspirerende groei, wyse gedagtes, emosionele uitdrukking, ens.
Genereer asseblief 'n volledige HTML/CSS/JavaScript-webwerf volgens die bogenoemde vereistes, en verseker dat die koppelvlak esteties aangenaam en funksioneel is en 'n goeie gebruikerservaring bied.
Hierdie toets is bloot om elke model se begrip van estetika te bepaal. Hierdie tipe vertoongerigte webblad is oor die algemeen haalbaar.
Dit moet gesê word dat Claude Opus 4 steeds redelik gesaghebbend is op hierdie gebied, met uitstekende aandag aan detail. Gemini 2.5 Pro is ook goed, en voeg selfs animasie-effekte by beeldoorgange. Deepseek en Sonnet 4 is op dieselfde vlak.
Deepseek-R1-0528: Ek het Deepseek eers laat loop en gedink dit was reeds redelik goed. Die eerste probleem met die algehele estetika was die musiekknoppie in die onderste linkerhoek, wat 'n bietjie te plat was. Die aanhalingsgedeelte het ook probleme gehad – die swart masker moes nie bygevoeg gewees het nie, en die teksbelyning was 'n bietjie verkeerd. Dit het egter 'n animasie-effek vir die verversing bygevoeg.
Claude Opus 4: Die estetika van Opus 4 is werklik foutloos. Die grootte en spasiëring van alle lettertipes is baie gemaklik, en die aanhalings vir die bekende gesegdes is met deursigtigheid hanteer vir beide die aanhalingsteks en die aanhalingstekens. Selfs die Spotify-speler is toegedraai in 'n gebruikerskoppelvlak met 'n uitbreiding/invou-animasie. Dis perfek.
Claude Sonnet 4: Sonnet 4 se effek is soortgelyk aan Deepseek se probleem. Die musiekspeelknoppie, teksgrootte, belyning en spasiëring kan alles verder geoptimaliseer word.
Gemini 2.5 Pro: Gemini se effek is ook goed, maar die verwydering van die teksskadu sou dit beter maak. Dit het ook die Spotify-speler se gebruikerskoppelvlak aangepas, en die teksbesonderhede is goed. Die oorgangseffek is opmerklik, met 'n strek-effek op die beeld.
Toets 5: Slaap-app bladsygenerering
Volgende is die mobiele toepassingstoets. Laat hulle elkeen 'n slaapmoniteringstoepassing skep. Die aanwysings sal die tegniese stapel- en ontwerpvereistes spesifiseer, en die generering van verskeie interaktiewe bladsye vereis.
Vra: Ontwikkelingsvereistes vir slaapmonitering-apps
Projekoorsig
Help my asseblief om 'n volledige slaapmoniteringsapp met vier hooffunksionele bladsye te skep. Die koppelvlak moet esteties aangenaam en professioneel wees.
Tegniese stapelvereistes
Voorkanttegnologieë
– HTML5 – Bladsystruktuur
– TailwindCSS v3.0+ – Stylraamwerk (bekendgestel via CDN)
– JavaScript – Noodsaaklike interaksielogika
– Anime.js v4.0.2 – Animasie-effekbiblioteek
- CDN:
https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm
Ikone en grafieke
- Ikoonbiblioteek: Font Awesome of Material Icons (CDN)
- Grafiekkomponente: Aanlyn grafiekkomponente, style moet ooreenstem met die tema
- Datavisualisering: Ondersteun grafiekweergawe van slaapdata
Ontwerpvereistes
Responsiewe ontwerp
- Volledig responsiewe uitleg
- Mobiel-eerste ontwerp
- Goeie vertoon op beide rekenaar- en mobiele toestelle
Interaksie-effekte
- Knoppie-interaksie: Effens vergrote effek met sweefbeweging
Vorminteraksie: Vertoon 'n gradiëntgrens wanneer die invoerveld gefokus is
Kaartinteraksie: Verduister die skaduwee wanneer dit oor die kaart beweeg word
Animasie-effekte: Gebruik Anime.js om gladde bladsy-animasies te verkry
Funksionele bladsyvereistes
Genereer asseblief alle bladsye wat benodig word vir 'n slaapmoniteringsapp, insluitend maar nie beperk tot:
- Tuisblad/dashboard
- Slaapoptekeningbladsy
- Data-analise bladsy
- Instellingsbladsy
- Ander verwante funksionele bladsye
Kode-uitvoervereistes
- Elke bladsy is 'n onafhanklike HTML-lêer
- Duidelike kodestruktuur met volledige kommentaar
- Maak seker dat alle CDN-skakels toeganklik is
- Verskaf volledige, uitvoerbare kode
Wat mobiele logika en koppelvlak betref, het Cluade Opus 4 weereens sy krag gedemonstreer deur verskeie bladsye met goeie logika te voltooi. Die ander modelle het slegs 'n enkele bladsy gegenereer, maar Deepseek R1 0528 het skielik die kol getref wat estetika betref, met 'n pragtige styl. Alhoewel dit slegs 'n enkele bladsy gegenereer het, was dit baie volledig.
Deepseek-R1-0528: Slegs 'n enkele bladsy gegenereer, maar die algehele estetika is goed. Die besonderhede van die kaarte en die hantering van die ikone is goed gedoen, en die hele bladsy is volledig en lank. Daarbenewens is responsiewe ontwerp vir die navigasie geïmplementeer, wat gelei het tot heeltemal verskillende uitlegte op mobiele en rekenaartoestelle.
Claude Opus 4: Inderdaad kragtig, slegs Opus4 het alle bladsye volledig gegenereer, maar die estetiese ontwerp hierdie keer is nie wonderlik nie, met behulp van webbladlogika, met navigasie-ikone wat te klein is.
Claude Sonnet 4: Slegs 'n enkele bladsy gegenereer en foute gerapporteer, met swak estetiese ontwerp, en net die taak voltooi.
Gemini 2.5 Pro: Google doen dinge altyd anders. Dit genereer elke bladsy individueel en verskaf vier lêers wat nie met mekaar kan kommunikeer nie. Daarbenewens het alle bladsye foute gerapporteer, met elke bladsy wat slegs navigasie en geen inhoud bevat nie, wat nogal teleurstellend is.
Toets 6: Komplekse Funksionaliteit—Tetris
Uiteindelik het ek afgesluit met 'n klein speltoets. Ek het 'n relatief komplekse Tetris-speletjie ontwerp met spesiale blokke, temawisseling, voorspelling van bloklanding, blokberging en meer – 'n ware ultieme uitdaging.
Vra: Help my asseblief om 'n volledig funksionele, visueel aantreklike Tetris-webspeletjie met die volgende vereistes te skep:
Kernspelkenmerke
- Volledige Tetris-meganisme: 7 standaardblokke (I, O, T, S, Z, J, L)
- Gladde kontroleslinks en regs beweging, rotasie, vinnige val, kitsval
- Slim eliminasiestelselondersteun die uitskakeling van 1-4 rye op 'n slag met spesiale animasie-effekte
- Progressiewe moeilikheidsgraadstelselverhoog outomaties die valspoed en vlak gebaseer op die aantal rye wat uitgeskakel word
Gevorderde kenmerke
- Voorskoustelselvertoon die volgende en volgende-volgende blokke
- Hou-funksieHou die Houd-knoppie in om die huidige blok tydelik te stoor. Kan slegs een keer per rondte gebruik word.
- SpookblokkeVertoon die landingsposisie van blokke in semi-deursigtige vorm
- KombinasiestelselDeurlopende skoonmaak gee ekstra punte en visuele effekte
- Spesiale Vaardighede:
- Bomblok (maak omliggende gebied skoon)
- Laser Clear (maak die hele ry skoon)
- Tydpouse (blokke hou op val vir 3 sekondes)
Visuele Ontwerpvereistes
- Moderne UI-koppelvlak:
- Gradiëntagtergrond of deeltjie-effekte
- Glaseffek-spelpaneel
- Gladde animasie-oorgange
- Responsiewe ontwerp vir verskillende skerms
- Ryk visuele effekte:
- Gladde animasie van blokke wat val en roteer
- Ontploffing of flitseffekte wanneer uitgeskakel
- Skermskud-effek wanneer kombinasie bereik word
- Viering-animasie wanneer vlak opgegradeer word
- TemastelselTen minste 3 verskillende visuele temas om tussen te wissel
Klankeffekstelsel
- Volledige klankterugvoerbeweging, rotasie, landing, eliminasie, spel einde, ens.
- Agtergrondmusiek: herhalende spel BGM
- Volumebeheeronafhanklik verstelbare klankeffekte en agtergrondmusiekvolume
Spelmodusse
- Klassieke modustradisionele Tetris-spel
- Tydsbeperkte modus: behaal die hoogste telling binne 'n gespesifiseerde tydsbeperking
- Uitdagingsmodusvoorafgestelde hindernisse om moeilikheidsgraad te verhoog
- Zen-modusgeen tydsdruk, pure genot van die spel
Datastatistieke-kenmerke
- Statistiek intydshuidige telling, vlak, aantal lyne skoongemaak, speeltyd
- Geskiedenishoogste telling, beste vlak, totale speeltyd
- Prestasiestelsel: ontsluit verskeie spelprestasies
- Plaaslike bergingstoor spelrekords en -instellings
Tegniese vereistes
- Gebruik suiwer HTML5/CSS3/JavaScript, geen eksterne raamwerke benodig nie
- Duidelike kodestruktuurobjekgeoriënteerde programmering, modulêre ontwerp
- Prestasie-optimaliseringgladde 60FPS animasie, geen vertraging nie
- Verenigbaarheidondersteun hoofstroom moderne blaaiers
- Responsiewe ontwerpVersoenbaar met rekenaars en mobiele toestelle
Gebruikerservaring
- Intuïtiewe instruksiesIngeboude tutoriaal en knoppie-aanwysings
- Pouseer/hervat funksie: Onderbreek die spel te eniger tyd
- InstellingskieslysPas spelmoeilikheidsgraad, klankeffekte, visuele effekte, ens. aan.
- SpelstatusbesparingOndersteun die stoor en hervatting van die spel
Kodekwaliteitvereistes
- Gedetailleerde kommentaarElke funksie en belangrike kodesegment moet 'n beskrywing hê
- FouthanteringOmvattende uitsonderingsopname- en hanteringsmeganisme
- Elegante kodeVolg beste praktyke, maklik om te verstaan en te onderhou
- UitbreidbaarheidMaklik om nuwe funksies in die toekoms by te voeg
Verskaf asseblief volledige HTML-lêers wat alle CSS- en JavaScript-kode bevat om te verseker dat hulle direk in 'n blaaier uitgevoer kan word. Die kode moet professionele programmeringsvaardighede en 'n diepgaande begrip van spelontwikkeling demonstreer.
In die mini-speletjie het Claude iets aan die gang. Beide Opus en Sonnet het die ooreenstemmende Tetris-blokke gegenereer soos vereis, veral die logika vir spesiale blokke. Deepseek het die tema wat Claude oor die hoof gesien het, hanteer, maar die spesiale blokke gemis, wat daartoe gelei het dat Gemini 2.5 Pro onspeelbare blokke gegenereer het.
Deepseek-R1-0528: Die taak is baie goed en volgens spesifikasies voltooi, maar die spesiale blokontwerp is weggelaat en glad nie geïmplementeer nie. Dit kan wees as gevolg van probleme met die volg van die aanwysingswoorde. Die hele webblad lyk soos 'n speletjie-koppelvlak, met alle knoppies wat soos standaardkomponente lyk.
Claude Opus 4: Het die logika vir spesiale blokke en ander logika sonder probleme voltooi, maar die aanwysing vir temawisseling geïgnoreer, wat hy nie geïmplementeer het nie. In vergelyking met DeepSeek se probleme, is dit 'n kleiner probleem, maar die koppelvlak is hardgekodeer met geen responsiewe logika nie, so die proporsies is effens af, wat sommige knoppies onklikbaar maak.
Claude Sonnet 4: Soortgelyk aan Opus, maar ek dink Sonnet 4 is beter as Opus. Die bladsy-aanpassing is ook goed. Dit voel asof Sonnet gewen het, aangesien dit al die vereiste funksies voltooi het.
Gemini 2.5 Pro: Gemini sukkel voortdurend met komplekse logika. Hierdie keer was dit heeltemal onbruikbaar omdat die plasing van die baksteen 'n fout gehad het, wat dit onmoontlik gemaak het om te voorspel waar hulle sou land. Dis die ergste.
Teen hierdie tyd dink ek jy is net so verbaas soos ek oor die DeepSeek-R1 se prestasie.
Dis moeilik om te glo dat dit net 'n klein modelopgradering is. Kom ons vergelyk die pryse van hierdie modelle met DeepSeek R1 0528.
Opus 4 is 30 keer duurder, en dit is met Openrouter se pryse – die amptelike prys sou selfs meer verstommend wees.
model | Kontekslengte | Invoerprys ($/M-tokens) | Uitsetprys ($/M-tokens) | beeldprys ($/K tokens) |
DeepSeek R1 0528 | 160k | 0.50 | 2.18 | – |
Gemini 2.5 pro voorskou | 1000k | 1.25 | 10 | 5.16 |
Claude Sonnet 4 | 200k | 3.00 | 15 | 4.80 |
Claude Opus 4 | 200k | 15.00 | 75 | 24.00 |
As iemand wat daagliks met KI-nuus te doen het, het ek tallose "deurbrake" gesien wat uiteindelik "teleurstellend" blyk te wees. Maar hierdie keer is dit anders. DeepSeek-R1 het my ware hoop gegee.
'n 30-voudige prysverskil, maar amper gelykstaande prestasie.
Ons hoef nie meer buitensporige pryse te betaal om die beste KI-programmeringsmodelle te gebruik nie, en ons hoef ook nie pynlike afwegings tussen koste en kwaliteit te maak nie. Wat nog meer inspirerend is, is dat dit ons eie model is.
Hierdie sin is deur KI geskryf, en ek dink dis wonderlik: Die ware rewolusie begin dikwels wanneer gewone mense na die sterre kan reik.