През последните няколко дни Deepseek-R1 0528 беше официално с отворен код.

В LiveCodeBench производителността му е почти наравно с o3 (високо) на OpenAI; в многоезичния бенчмарк тест на Aider, той се справя добре с Claude Opus.

Когато беше пуснат на официалния уебсайт, бързо тествахме възможностите му от предния край и установихме, че те са изключително силни, което доведе до тестовете, разгледани в тази статия. Целта ни е да споделим с вас специфичната производителност на различните модели.

Важно е да се отбележи, че този тест се фокусира предимно върху възможностите на front-end компонентите, така че е от съществено значение да се оцени обективно производителността на различните модели. Можете да използвате предоставените от нас указания, за да проведете свои собствени тестове и да споделите своите прозрения и открития.

Използвайки същата команда, го изпратихме до Claude Opus 4, Sonnet 4, Gemini 2.5 Pro и DeepSeek R1-0528и ги накара да се състезават в шест все по-предизвикателни задачи за разработка на front-end елементи.

За тези, които нямат търпение, ето заключението:

Deepseek-R1-0528 леко изостава от Opus 4 по отношение на възможностите на front-end, но го превъзхожда. Сонет 4 и Джемини 2.5 Про.

По принцип, всяка задача, която Opus може да изпълни, може да се изпълни и от R1, и дори задачи, които Opus 4 не може да изпълни, R1 може да се справи, макар и с малко по-ниски нива на изпълнение и качество на резултатите.

Като се има предвид ценовата разлика между R1 и останалите три, това представяне вече е отлично и можем само да си представим колко впечатляващ ще бъде R2.

Съдържание

Тест 1: Система за управление на складове

Подкана: Моля, помогнете ми да създам цялостен уеб-базиран инструмент за управление на продукти със следните изисквания:

Функционални изисквания

  1. Управление на продукти
  • Въвеждане на информация за продуктаИме на продукта, вид/категория, SKU номер, цена, количество на склад
  • Управление на имиджа на продуктаПоддръжка на качване и преглед на изображения (симулирано със селектор на файлове)
  • Показване на списъка с продуктиПоказване на всички продукти в табличен формат, с поддръжка на търсене и филтриране
  • Редактиране на продуктиПоддръжка на промяна на информацията за продукта
  • Изтриване на продуктПоддръжка на изтриване на продукт (с подкана за потвърждение)
  1. Управление на инвентара
  • Входящи операцииУвеличете количеството на складовите наличности на продукти, запишете времето и количеството на входящите доставки
  • Изходящи операцииНамалете количеството на продуктите в наличност, запишете времето и количеството на изходящите доставки
  • Записи за инвентаризация: Показва историята на промените в наличностите за всеки продукт
  1. Функции на интерфейса
  • Информационно табло: Показва статистически данни като общ брой продукти, обща стойност на наличностите, известия за ниски наличности и др.
  • Адаптивен дизайнАдаптивен за настолни компютри и мобилни устройства
  • Устойчивост на даннитеИзползва localStorage за запазване на данни

Технически изисквания

Стилове и икони

  • CSS рамкаИзползва TailwindCSS 3.0+ CDN
  • Библиотека с икониИзползва героични икони или икони с пера CDN
  • ШрифтИзползвайте шрифтове на Google

Структура на кода

  • Приложение на една страницаHTML + CSS + JavaScript
  • Модулен дизайнРазделете функциите в различни JavaScript модули
  • Формат на даннитеИзползвайте JSON формат за съхранение на данни за продукта

Изисквания за дизайн на интерфейса

  • Модерен потребителски интерфейс: Прост и красив дизайн на интерфейса
  • Цветова схемаИзползвайте професионални бизнес цветови комбинации
  • Интерактивна обратна връзкаЩраквания върху бутони, валидиране на формуляри и други интерактивни ефекти
  • Валидиране на формуляриВалидиране на задължителни полета, валидиране на формата на данните

Пример за структура на данни

Моля, генерирайте пълен HTML файл, съдържащ целия необходим CSS и JavaScript код, като се уверите, че всички функции са функционални и могат да се изпълняват директно в браузър.

Нека да разгледаме резултатите от теста. Логиката всъщност е доста сложна, като тества дължината на контекста на модела, естетическото усещане и възможностите за логическа обработка.

В този случай всички модели с изключение на Deepseek се провалиха. Преводът на Клод 4 беше доста странно, честно казано.

Deepseek-R1-0528: Обновената версия на R1 е много мощна. Както виждате, интерфейсът е много професионален и можете също така да създавате нови продукти, да извършвате нормални изходящи и входящи операции, както и да разделяте продукти, управление на инвентара и отчети за инвентара на три страници, което е много ясно като цяло. Има и специална страница за табло, а той е написал някои примерни данни за тестване. Другите модели нямат данни и добавянето на продукти не работи, така че тестването е напълно невъзможно.

Клод Опус 4: Започва с голям, много опростен интерфейс, използващ горна навигационна лента вместо страничната лента, обичайна за SaaS платформите. Добавянето на продукти води до грешка при запазване, което прави тестването невъзможно.

Клод Сонет 4: В сравнение с Opus 4, интерфейсът е още по-основен. Щракването върху бутона „Добавяне на продукт“ не реагира и не се появява изскачащ формуляр. Другите страници са по същество просто заместители.

Джемини 2.5 Про: Версията на Google е по-добра от тази на Claude. Позволява добавяне на продукти и серии, но има грешки. Работеше, когато го пробвах за първи път, но не и когато записах видео. Дизайнът на взаимодействието на Gemini обаче е доста сложен, с управление на инвентара и водене на записи в една таблица, което добавя известни трудности.

Тест 2: Редактор на пикселна анимация

Следва тест за визуални способности. Помолих ги да създадат редактор за пикселна анимация, използвайки P5.js, поддържащ режими на движение, настройващ форми, размери, скорости и други условия на точките.

Задача: Създайте генератор за интерактивна пикселна анимация на цял екран, базиран на P5.js, който отговаря на следните технически изисквания:

Основни характеристики

  • Реализирайте пикселна анимация на цял екран, използвайки P5.js, като анимацията покрива цялата област на viewport-а.
  • Общата площ на пикселната мрежа трябва да бъде поне 10 пъти видимата площ, за да се осигури пълно покритие дори при най-малкото разстояние между пикселите.
  • Осигурява множество режими на анимация: вълна, импулс, пулсация, шум
  • Поддържа множество опции за форма на точки: кръг, квадрат, кръст, триъгълник, ромб и др.
  • Всички контролни панели са разположени от дясната страна на страницата и могат да бъдат свити додолу на мобилни устройства.

Регулируеми параметри

  • Плътност на точките: Контролирайте броя на точките на ред/колона
  • Размер на формата: Регулирайте размера на точките
  • Скорост на анимацията: Контролирайте скоростта и амплитудата на анимационния ефект
  • Разстояние между точките: Регулиране на разстоянието между точките

Технически спецификации

  • Използвайте HTML5, TailwindCSS 3.0+ (въведен чрез CDN) и P5.js
  • Внедрете пълна функционалност за превключване на тъмен/светъл режим, като по подразбиране се използват системните настройки.
  • Кодът трябва да включва логика за оптимизация на производителността, като рендира само точки във видимата област и близо до краищата.
  • Анимациите трябва да се изпълняват гладко, без забавяне

Адаптивен дизайн

  • Страниците трябва да се показват перфектно на всички устройства (мобилни устройства, таблети, настолни компютри)
  • Контролните панели трябва да са сгъваеми/разгъваеми в мобилен изглед
  • Оптимизирайте оформлението и размера на шрифта за различни размери на екрана
  • Осигурете добро изживяване при докосване на мобилни устройства

Елементи на интерфейса

  • Селектор за режим на анимация (вълна, импулс, пулсация, шум)
  • Селектор на форми (показва различни форми с икони)
  • Плъзгащи контроли: плътност, размер, скорост, разстояние
  • Бутон за превключване на тема
  • Показване на информация за наслагване на матрица и общ брой точки

Разгледайте резултатите. Честно казано, не очаквах другите модели да се представят толкова зле в този тест. С изключение на Deepseek-R1, анимациите на останалите модели изобщо не работеха.

Deepseek-R1-0528: Абсолютно безупречен. Всеки бутон и плъзгач функционира нормално, а точките се движат плавно. Дори добави матрични данни, а цветовете остават постоянни след превключване в нощен режим. Единственият дребен проблем е, че избраното състояние на избора на цвят има лек проблем, но това е незначително в сравнение с катастрофалното представяне на другите модели.

Клод Опус 4: Добра новина: има пикселна графика. Лоша новина: не се движи. Съдържанието от дясната страна може да се управлява нормално, но цветовата схема е неправилна след превключване в нощен режим.

Клод Сонет 4: Това е катастрофа. Няма пиксел арт и дори бутонът за избор на състояние липсва. Плъзгачите са просто точки - все едно да се използват компонентите по подразбиране.

Джемини 2.5 Про: Също така съобщава за грешка без пикселна мрежа. Съдържанието от дясната страна може да се управлява нормално и превключването на теми работи добре, но компонентите по подразбиране са малко грозни.

Тест 3: Инструмент за извличане на цветове от градиент на изображение

Това е инструмент, който написах по-рано. Няма много описание на логиката, но има повече описание на стила. Основната функция е да извлече пет комплекта градиентни цветове от изображение.

Подкана: Генерирайте HTML уеб страница въз основа на следното файлово съдържание, поддържайте извличане на пет комплекта градиентни цветове от качени изображения и позволете на потребителите директно да копират петте комплекта шестнадесетични градиентни цветове. Необходимо е да се имплементира функцията за извличане на цветове.

  1. Използвайте визуален дизайн в стил NetEase Cloud Music, бял фон с цвят, подобен на #FE1110, като акцент
  2. Подчертайте големи шрифтове или цифри, за да откроите ключови моменти. Включете големи визуални елементи, за да подчертаете фокусните области, създавайки контраст с по-малките елементи.
  3. Смесвайте китайски и английски текст. Използвайте удебелени, големи китайски букви и по-малък английски текст като акценти.
  4. Използвайте прости линейни графики за визуализация на данни или като декоративни елементи.
  5. Използвайте градиента на прозрачност на цветовете за акцентиране, за да създадете технологично вдъхновен ефект, но се уверете, че различните цветове за акцентиране не се сливат един с друг.
  6. Имитирайте анимациите на официалния уебсайт на Apple, като скролирането с мишката задейства анимации
  7. Данните могат да бъдат препращани от онлайн компоненти на диаграми, със стилове, съответстващи на темата
  8. Използвайте Framer Motion (чрез CDN)
  9. Използвайте HTML5, TailwindCSS 3.0+ (чрез CDN) и необходимия JavaScript
  10. Използвайте професионални библиотеки с икони, като например Font Awesome или Material Icons (чрез CDN).
  11. Избягвайте използването на емоджита като основни икони
  12. Бутонът за капсула в долния ляв ъгъл показва профила на автора в Twitter

В този случай, Клод най-накрая се е справил чудесно. Детайлите и естетиката на страницата на Deepseek-R1-0528 са впечатляващи, но функционалността не е имплементирана. Страниците на Opus 4 и Sonnet 4 са по-прости, но поне функционални, докато Gemini изобщо не е функционална.

Deepseek-R1-0528: След като отново използвах моята подкана, естетиката на страницата на Deepseek е наистина несравнима. Той също така добави много SEO-съвместимо съдържание към страницата, като например сценарии на приложения и време за обработка. Картите с градиентни цветове за показване също са много детайлни, но логиката за избор на цвят не е имплементирана.

Клод Опус 4: Този път Клод най-накрая не разочарова, като завърши функционалността на страницата, но съдържанието ѝ е много основно, само с място за качване на изображения и резултатите, а логиката за избор на цвят също е лоша. Въпреки това, поне работи.

Клод Сонет 4: Sonnet 4 също завърши функционалността и дори мисля, че резултатите на Sonnet са по-добри от тези на Opus, въпреки че все още не е толкова богат, колкото Deepseek.

Джемини 2.5 Про: Това е най-лошото. Не само липсват детайли и естетика на страницата, но и функционалността не е имплементирана и се срива при стартиране.

Тест 4: Уебсайт за ежедневни оферти за бял шум

Следва генератор на ежедневни оферти с бял шум, който е идеален за плъгин за нов раздел в страницата. Той поддържа възпроизвеждане на бял шум от Spotify и уеб страницата се показва.

Подкана: Моля, помогнете ми да създам прост и елегантен уебсайт за ежедневни оферти със следните изисквания:

Визуален дизайн

  • Фоново изображение: Изберете произволно висококачествени пейзажни изображения от следните връзки като фоново изображение
  • Връзки към изображенияXXXX
  • Обработка на изображенияДобавете черна маска 25% и леко Гаусово размазване, за да гарантирате, че текстът ще остане ясен и четлив.
  • Общ стилМинималистичен и модерен, с пейзажни изображения като фон на уеб страницата за по-добро потапяне
  • Използвайте anime.js (въведен чрез CDN: JsDelivr jsdelivr.com) за анимационната рамка, HTML5, TailwindCSS 3.0+ (въведен чрез CDN) и необходимия JavaScript, както и професионални библиотеки с икони като Font Awesome или Material Icons (въведени чрез CDN).

Модул за показване на време

  • Най-горе: Показване на месеца и деня във формат (напр. „29 май“) с по-малък шрифт, центрирано
  • Втори ред: Показва формата „Седмица X · Лунен календар X-ти месец X-ти ден“ с по-малък шрифт
  • Център: Маркира текущата дата с голям бял шрифт, центрирано

Модул за показване на оферти

  • Съдържание: Случайно показва класически цитати от китайски и чуждестранни философи и писатели
  • ОформлениеЦитатите са центрирани, размерът на шрифта е умерен, а разстоянието между редовете е удобно
  • Приписване: „Писател, XXX“ или „Философ, XXX“ се показва в долния десен ъгъл
  • Библиотека с офертиСъдържа цитати по различни теми като мотивация, житейски прозрения и мъдрост

Функция за възпроизвеждане на музика

  • МестоположениеДолен ляв ъгъл на страницата, свит по подразбиране
  • СъдържаниеВграждане на плейлист с бял шум в Spotify
  • Код:

Техническо изпълнение

  • Адаптивен дизайнАдаптирано за настолни компютри и мобилни устройства
  • Избор на шрифтИзползвайте елегантни китайски шрифтове, въведени от Google Fonts
  • Цветова схемаИзползвайте предимно бял текст, за да осигурите четливост на всички фонове.
  • Оптимизация на зарежданетоЛениво зареждане на изображения за подобряване на производителността на страницата

Интерактивни функции

  • Автоматично опресняване: Автоматично променя фоновото изображение и цитата всеки ден
  • Ръчно обновяване: Предоставя бутон за обновяване, който позволява на потребителите ръчно да променят съдържанието

Стил на копирайтинг

  • Избор на офертаПредпочитайте кратки, позитивни и философски цитати.
  • Езиков стилКратко и въздействащо, като се избягва прекомерната дължина
  • Класификация на темитеЖитейски прозрения, вдъхновяващ растеж, мъдри мисли, емоционално изразяване и др.

Моля, генерирайте цялостен HTML/CSS/JavaScript уебсайт съгласно горепосочените изисквания, като се уверите, че интерфейсът е естетически приятен, функционален и осигурява добро потребителско изживяване.

Този тест е единствено за оценка на разбирането на всеки модел за естетика. Този тип уеб страница, ориентирана към дисплей, обикновено е постижима.

Трябва да се каже, че Claude Opus 4 все още е доста авторитетен в тази област, с отлично внимание към детайлите. Gemini 2.5 Pro също е добър, дори добавя анимационни ефекти към преходите между изображенията. Deepseek и Sonnet 4 са на същото ниво.

Deepseek-R1-0528: Първо пуснах Deepseek и си помислих, че вече е доста добър. Първият проблем с цялостната естетика беше бутонът за музика в долния ляв ъгъл, който беше малко прекалено плосък. Секцията с цитати също имаше проблеми - черната маска не трябваше да се добавя, а подравняването на текста беше малко неправилно. Въпреки това, добави анимационен ефект за опресняването.

Клод Опус 4: Естетиката на Opus 4 е наистина безупречна. Размерът и разстоянието между всички шрифтове са много удобни, а цитатите на известните поговорки са обработени с прозрачност както за текста на цитата, така и за кавичките. Дори плейърът на Spotify е обвит в потребителски интерфейс с анимация за разгъване/свиване. Перфектно е.

Клод Сонет 4: Ефектът на Sonnet 4 е подобен на този на Deepseek. Бутонът за възпроизвеждане на музика, размерът на текста, подравняването и разстоянието могат да бъдат допълнително оптимизирани.

Джемини 2.5 Про: Ефектът на Gemini също е добър, но премахването на сянката на текста би го направило по-добър. Също така е персонализиран потребителският интерфейс на Spotify плейъра и детайлите на текста са добре. Преходният ефект е забележим, с ефект на разтягане върху изображението.

Тест 5: Генериране на страница за приложение за сън

Следва тестът на мобилното приложение. Нека всеки от тях създаде приложение за наблюдение на съня. В подканата ще бъдат посочени техническият стек и изискванията за дизайн, както и ще се изисква генерирането на множество интерактивни страници.

Подкана: Изисквания за разработване на приложение за наблюдение на съня

Преглед на проекта

Моля, помогнете ми да създам цялостно приложение за наблюдение на съня с четири основни функционални страници. Интерфейсът трябва да бъде естетически приятен и професионален.

Технически изисквания за стека

Фронтенд технологии

HTML5 – Структура на страницата

TailwindCSS v3.0+ – Стилна рамка (въведена чрез CDN)

JavaScript – Необходима логика на взаимодействие

Anime.js v4.0.2 – Библиотека с анимационни ефекти

  • CDN: https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm

Икони и диаграми

  • Библиотека с икони: Font Awesome или Material Icons (CDN)
  • Компоненти на диаграмата: Компонентите на онлайн диаграмата, стиловете трябва да са в съответствие с темата
  • Визуализация на данни: Поддържа графично представяне на данни за съня

Изисквания за дизайн

Адаптивен дизайн

  • Напълно адаптивен дизайн
  • Дизайн, ориентиран към мобилните устройства
  • Добър дисплей както на настолни компютри, така и на мобилни устройства

Ефекти на взаимодействие

  • Взаимодействие с бутони: Леко увеличен ефект при задържане на курсора върху бутона

Взаимодействие с формуляра: Показване на градиентна рамка, когато полето за въвеждане е фокусирано

Взаимодействие с картата: Потъмняване на сянката при задържане на курсора

Анимационни ефекти: Използвайте Anime.js за постигане на плавни анимации на страници

Функционални изисквания за страницата

Моля, генерирайте всички страници, необходими за приложение за наблюдение на съня, включително, но не само:

  • Начална страница/табло за управление
  • Страница със записи на съня
  • Страница за анализ на данни
  • Страница с настройки
  • Други свързани функционални страници

Изисквания за изходен код

  • Всяка страница е независим HTML файл
  • Ясна структура на кода с пълни коментари
  • Уверете се, че всички CDN връзки са достъпни
  • Предоставете пълен, изпълним код

По отношение на мобилната логика и интерфейс, Cluade Opus 4 за пореден път демонстрира своята мощ, завършвайки множество страници с добра логика. Другите модели генерираха само една страница, но Deepseek R1 0528 изведнъж постигна успех по отношение на естетиката, с красив стил. Въпреки че генерира само една страница, тя беше много завършена.

Deepseek-R1-0528: Генерирах само една страница, но цялостната естетика е добра. Детайлите на картите и обработката на иконите са добре направени, а цялата страница е завършена и дълга. Освен това беше внедрен адаптивен дизайн за навигацията, което доведе до напълно различни оформления на мобилни и настолни устройства.

Клод Опус 4: Наистина мощно, само Opus4 генерира всички страници напълно, но естетическият дизайн този път не е добър, използвайки логиката на уеб страниците, с твърде малки икони за навигация.

Клод Сонет 4: Генерирах само една страница и докладвах грешки, с лош естетически дизайн, просто завърших задачата.

Джемини 2.5 Про: Google винаги прави нещата по различен начин. Той генерира всяка страница поотделно, предоставяйки четири файла, които не могат да взаимодействат помежду си. Освен това, всички страници отчетоха грешки, като всяка страница съдържаше само навигация и никакво съдържание, което е доста разочароващо.

Тест 6: Сложна функционалност – Tetris

Накрая завърших с малък тест на играта. Проектирах сравнително сложна игра Tetris със специални блокове, превключване на теми, предвиждане на кацане на блокове, съхранение на блокове и други - истинско върховно предизвикателство.

Подкана: Моля, помогнете ми да създам напълно функционална, визуално привлекателна уеб игра Tetris със следните изисквания:

Основни характеристики на играта

  1. Пълен механизъм на Тетрис7 стандартни блока (I, O, T, S, Z, J, L)
  2. Плавно управление: движение наляво и надясно, въртене, бързо пускане, незабавно пускане
  3. Интелигентна система за елиминиране: поддържа елиминиране на 1-4 реда наведнъж със специални анимационни ефекти
  4. Прогресивна система за трудност: автоматично увеличава скоростта и нивото на падане въз основа на броя елиминирани редове

Разширени функции

  1. Система за предварителен преглед: показва следващия и следващ-следващ блок
  2. Функция за задържанеЗадръжте клавиша Hold, за да съхраните временно текущия блок. Може да се използва само веднъж на рунд.
  3. Призрачни блоковеПоказва позицията на кацане на блоковете в полупрозрачен вид
  4. Комбинирана системаНепрекъснатото почистване дава допълнителни точки и визуални ефекти
  5. Специални умения:
    1. Блокиране с бомби (изчиства околността)
    2. Лазерно изчистване (изчиства целия ред)
    3. Времева пауза (блоковете спират да падат за 3 секунди)

Изисквания за визуален дизайн

  1. Модерен потребителски интерфейс:
    1. Градиентен фон или ефекти на частици
    2. Игрален панел със стъклен ефект
    3. Плавни анимационни преходи
    4. Адаптивен дизайн за различни екрани
  2. Богати визуални ефекти:
    1. Плавна анимация на падащи и въртящи се блокове
    2. Ефекти от експлозия или светкавица при елиминиране
    3. Ефект на трептене на екрана при постигане на комбинацията
    4. Анимация за празненство при повишаване на нивото
  3. Тематична системаПоне 3 различни визуални теми за превключване между тях

Система за звукови ефекти

  1. Пълна звукова обратна връзка: движение, ротация, кацане, елиминиране, край на играта и др.
  2. Фонова музика: фонова музика от игра
  3. Контрол на силата на звуканезависимо регулируеми звукови ефекти и сила на звука на фоновата музика

Режими на игра

  1. Класически режимтрадиционен геймплей на Tetris
  2. Режим с ограничено време: постигнете най-висок резултат в рамките на определен срок
  3. Режим на предизвикателствопредварително зададени препятствия за увеличаване на трудността
  4. Дзен режимбез напрежение във времето, чисто удоволствие от играта

Функции за статистика на данните

  1. Статистика в реално времетекущ резултат, ниво, брой изчистени линии, време на играта
  2. Историянай-висок резултат, най-добро ниво, общо време за игра
  3. Система за постижения: отключете различни игрови постижения
  4. Локално съхранениезапазване на игрови записи и настройки

Технически изисквания

  1. Използва чист HTML5/CSS3/JavaScript, не са необходими външни рамки
  2. Ясна структура на кодаобектно-ориентирано програмиране, модулен дизайн
  3. Оптимизация на производителността: плавна 60FPS анимация, без забавяне
  4. Съвместимост: поддържа основните съвременни браузъри
  5. Адаптивен дизайнСъвместим с компютри и мобилни устройства

Потребителско изживяване

  1. Интуитивни инструкцииВграден урок и бутони за подкани
  2. Функция за пауза/възобновяване: Паузирайте играта по всяко време
  3. Меню с настройки: Регулиране на трудността на играта, звуковите ефекти, визуалните ефекти и др.
  4. Запазване на състоянието на игратаПоддържа запазване и възобновяване на играта

Изисквания за качество на кода

  1. Подробни коментариВсяка функция и важен сегмент от кода трябва да имат описание
  2. Обработка на грешкиЦялостен механизъм за улавяне и обработка на изключения
  3. Елегантен кодСледвайте най-добрите практики, лесни за разбиране и поддръжка
  4. РазширяемостЛесно добавяне на нови функции в бъдеще

Моля, предоставете пълни HTML файлове, съдържащи целия CSS и JavaScript код, за да се гарантира, че те могат да се изпълняват директно в браузър. Кодът трябва да демонстрира професионални умения за програмиране и задълбочено разбиране на разработването на игри.

В мини-играта, Клод е направил нещо. Както Opus, така и Sonnet са генерирали съответните блокове на Tetris, както е необходимо, особено логиката за специалните блокове. Deepseek е обработил темата, която Клод е пропуснал, но е пропуснал специалните блокове, което е довело до генериране на неиграеми блокове в Gemini 2.5 Pro.

Deepseek-R1-0528: Задачата беше изпълнена много добре и съгласно спецификациите, но специалният дизайн на блоковете беше пропуснат и изобщо не беше реализиран. Това може да се дължи на проблеми със следването на подканите. Цялата уеб страница наподобява интерфейс на игра, като всички бутони изглеждат като стандартни компоненти.

Клод Опус 4: Завърши логиката за специални блокове и друга логика без проблеми, но игнорира подканата за превключване на тема, която не е имплементирал. В сравнение с проблемите на DeepSeek, това е по-малък проблем, но интерфейсът е твърдо кодиран без адаптивна логика, така че пропорциите са леко неправилни, което прави някои бутони некликаеми.

Клод Сонет 4: Подобно на Opus, но мисля, че Sonnet 4 е по-добър от Opus. Адаптацията на страницата също е добра. Сякаш Sonnet спечели, тъй като изпълни всички необходими функции.

Джемини 2.5 Про: Джемини постоянно се бори със сложна логика. Този път беше напълно неизползваем, защото разположението на тухличките имаше грешка, което правеше невъзможно да се предвиди къде ще се приземят. Това е най-лошото.

Мисля, че вече сте също толкова изумени, колкото и аз, от представянето на DeepSeek-R1.

Трудно е да се повярва, че това е само малко подобрение на модела. Нека сравним цените на тези модели с DeepSeek R1 0528.

Opus 4 е 30 пъти по-скъп, и това е при ценообразуване на Openrouter – официалната цена би била още по-зашеметяваща.

моделДължина на контекстаВходна цена ($/M токени)Цена на продукцията ($/M токени)цена на изображението ($/K токена)
DeepSeek R1 0528160 хиляди0.502.18
Преглед на Gemini 2.5 pro1000 хиляди1.25105.16
Клод Сонет 4200 хиляди3.00154.80
Клод Опус 4200 хиляди15.007524.00

Като човек, който ежедневно се занимава с новини за изкуствения интелект, съм бил свидетел на безброй „пробиви“, които в крайна сметка се оказват „разочароващи“. Но този път е различно. DeepSeek-R1 ми даде истинска надежда.

30-кратна разлика в цената, но почти еквивалентна производителност.

Вече не е нужно да плащаме прекомерни цени, за да използваме най-добрите модели за програмиране на изкуствен интелект, нито пък да правим болезнени компромиси между цена и качество. Още по-вдъхновяващо е, че това е нашият собствен модел.

Това изречение е написано от изкуствен интелект и според мен е страхотно: Истинската революция често започва, когато обикновените хора могат да посегнат към звездите.

Подобни публикации

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *