Au cours des derniers jours, Deepseek-R1 0528 a été officiellement open source.

Sur LiveCodeBench, ses performances sont presque égales à celles d'OpenAI o3 (élevé) ; dans le test de référence multilingue d'Aider, il tient tête à Claude Opus.

Lors de son lancement sur le site officiel, nous avons rapidement testé ses fonctionnalités front-end et les avons trouvées exceptionnellement performantes, ce qui a conduit aux tests présentés dans cet article. Nous souhaitons partager avec vous les performances spécifiques de différents modèles.

Il est important de noter que ce test se concentre principalement sur les fonctionnalités front-end ; il est donc essentiel d'analyser objectivement les performances des différents modèles. Vous pouvez utiliser les instructions fournies pour réaliser vos propres tests et partager vos observations et conclusions.

En utilisant la même invite, nous l'avons envoyé à Claude Opus 4, Sonnet 4, Gemini 2.5 Pro et DeepSeek R1-0528, et les a fait concourir dans six tâches de développement front-end de plus en plus difficiles.

Pour ceux qui ne peuvent pas attendre, voici la conclusion :

Deepseek-R1-0528 est légèrement inférieur à Opus 4 en termes de capacités frontales, mais le surpasse Sonnet 4 et Gemini 2.5 Pro.

Fondamentalement, toute tâche qu'Opus peut accomplir, R1 peut également la réaliser, et même les tâches qu'Opus 4 ne peut pas accomplir, R1 peut les gérer, bien qu'avec des taux d'achèvement et une qualité de résultat légèrement inférieurs.

Compte tenu de la différence de prix entre le R1 et les trois autres, cette performance est déjà excellente, et nous ne pouvons qu'imaginer à quel point le R2 sera impressionnant.

Test 1 : Système de gestion d'entrepôt

Invite : Veuillez m'aider à créer un outil de gestion de produits Web complet avec les exigences suivantes :

Exigences fonctionnelles

  1. Gestion de produits
  • Saisie des informations sur le produit: Nom du produit, type/catégorie, numéro SKU, prix, quantité en stock
  • Gestion de l'image du produit: Prise en charge du téléchargement et de l'aperçu des images (simulé avec un sélecteur de fichiers)
  • Affichage de la liste des produits:Afficher tous les produits sous forme de tableau, avec prise en charge de la recherche et du filtrage
  • Édition de produits: Prise en charge de la modification des informations sur les produits
  • Suppression du produit: Prise en charge de la suppression du produit (avec invite de confirmation)
  1. Gestion des stocks
  • Opérations entrantes: Augmenter la quantité de produits en stock, enregistrer le temps et la quantité entrants
  • Opérations sortantes: Diminuer la quantité de produits en stock, enregistrer le temps et la quantité de sortie
  • Registres d'inventaire: Affiche l'historique des variations d'inventaire pour chaque produit
  1. Fonctionnalités de l'interface
  • Tableau de bord: Affiche des statistiques telles que le nombre total de produits, la valeur totale des stocks, les alertes de faible stock, etc.
  • Conception réactive:Adaptable aux ordinateurs de bureau et aux appareils mobiles
  • Persistance des données:Utilise localStorage pour enregistrer les données

Exigences techniques

Styles et icônes

  • Cadre CSS:Utilise TailwindCSS 3.0+ CDN
  • Bibliothèque d'icônes:Utilise Heroicons ou Feather Icons CDN
  • Fonte:Utiliser les polices Google

Structure du code

  • Demande d'une seule page: HTML + CSS + JavaScript
  • Conception modulaire: Décomposer les fonctions en différents modules JavaScript
  • Format des données:Utilisez le format JSON pour stocker les données du produit

Exigences de conception d'interface

  • Interface utilisateur moderne:Conception d'interface simple et belle
  • palette de couleurs:Utilisez des combinaisons de couleurs professionnelles
  • Rétroaction interactive:Clics sur les boutons, validation de formulaire et autres effets interactifs
  • Validation du formulaire: Validation des champs obligatoires, validation du format des données

Exemple de structure de données

Veuillez générer un fichier HTML complet contenant tout le code CSS et JavaScript nécessaire, en vous assurant que toutes les fonctionnalités sont fonctionnelles et peuvent s'exécuter directement dans un navigateur.

Examinons les résultats des tests. La logique est en réalité assez complexe, testant la longueur du contexte, le sens esthétique et les capacités de traitement logique du modèle.

Dans ce cas, tous les modèles, à l’exception de Deepseek, ont échoué. Traduction de Claude 4 C'était assez étrange, pour être honnête.

Deepseek-R1-0528 : La version améliorée de R1 est très puissante. Comme vous pouvez le constater, l'interface est très professionnelle. Vous pouvez également créer de nouveaux produits, effectuer des opérations entrantes et sortantes normales, et diviser la gestion des produits, des stocks et des rapports d'inventaire en trois pages, ce qui est globalement très clair. Un tableau de bord dédié est également disponible, et des exemples de données ont été créés pour les tests. Les autres modèles ne contiennent aucune donnée, et l'ajout de produits est impossible, rendant les tests totalement impossibles.

Claude Opus 4 : L'interface est vaste et très simple, avec une barre de navigation supérieure au lieu de la barre latérale habituelle des plateformes SaaS. L'ajout de produits génère une erreur lors de l'enregistrement, rendant les tests impossibles.

Claude Sonnet 4 : Comparée à Opus 4, l'interface est encore plus basique. Cliquer sur le bouton « Ajouter un produit » ne répond pas et aucun formulaire ne s'affiche. Les autres pages ne sont que des espaces réservés.

Gemini 2.5 Pro : La version de Google est meilleure que celle de Claude. Elle permet d'ajouter des produits et des cycles, mais présente des bugs. Elle fonctionnait lors de mon premier essai, mais pas lors de l'enregistrement d'une vidéo. Cependant, la conception des interactions de Gemini est assez complexe, la gestion des stocks et la tenue des registres étant centralisées dans une seule table, ce qui complique les choses.

Test 2 : Éditeur d'animations de pixels

Ensuite, un test de capacité visuelle a été réalisé. Je leur ai demandé de créer un éditeur d'animation pixel art avec P5.js, prenant en charge les modes de mouvement et ajustant les formes, tailles, vitesses et autres paramètres des points.

Invite : Créez un générateur d’animation pixel art interactif plein écran basé sur P5.js, répondant aux exigences techniques suivantes :

Fonctionnalités principales

  • Implémentez une animation pixel art plein écran à l'aide de P5.js, l'animation couvrant toute la zone de la fenêtre d'affichage
  • La surface totale de la grille de pixels doit être au moins 10 fois supérieure à la surface visible pour garantir une couverture complète, même avec le plus petit espacement de grille.
  • Propose plusieurs modes d'animation : Vague, Impulsion, Ondulation, Bruit
  • Prend en charge plusieurs options de forme de point : cercle, carré, croix, triangle, losange, etc.
  • Tous les panneaux de contrôle sont placés sur le côté droit de la page et peuvent être réduits vers le bas sur les appareils mobiles

Paramètres réglables

  • Densité de points : contrôlez le nombre de points par ligne/colonne
  • Taille de la forme : ajustez la taille des points
  • Vitesse d'animation : Contrôlez la vitesse et l'amplitude de l'effet d'animation
  • Espacement de la grille : ajustez la distance entre les points

Spécifications techniques

  • Utilisez HTML5, TailwindCSS 3.0+ (introduit via CDN) et P5.js
  • Implémenter la fonctionnalité complète de commutation du mode sombre/clair, en utilisant par défaut les paramètres système
  • Le code doit inclure une logique d'optimisation des performances, en rendant uniquement les points dans la zone visible et près des bords
  • Les animations doivent se dérouler de manière fluide et sans décalage

Conception réactive

  • Les pages doivent s'afficher parfaitement sur tous les appareils (mobile, tablette, ordinateur)
  • Les panneaux de contrôle doivent être pliables/extensibles dans la vue mobile
  • Optimiser la mise en page et la taille des polices pour différentes tailles d'écran
  • Assurez une bonne expérience tactile sur les appareils mobiles

Éléments d'interface

  • Sélecteur de mode d'animation (onde, impulsion, ondulation, bruit)
  • Sélecteur de formes (affiche différentes formes avec des icônes)
  • Contrôles du curseur : densité, taille, vitesse, espacement
  • Bouton de changement de thème
  • Afficher les informations de superposition de la matrice et le nombre total de points

Regardez les résultats. Honnêtement, je ne m'attendais pas à ce que les autres modèles obtiennent des résultats aussi médiocres lors de ce test. À l'exception de Deepseek-R1, les animations des autres modèles n'ont pas fonctionné du tout.

Deepseek-R1-0528 : Parfaitement impeccable. Chaque bouton et curseur fonctionne normalement, et les points se déplacent avec fluidité. L'appareil a même ajouté des données matricielles, et les couleurs restent homogènes après le passage en mode nuit. Seul petit problème : la sélection des couleurs présente un léger problème, mais c'est négligeable comparé aux performances désastreuses des autres modèles.

Claude Opus 4 : Bonne nouvelle : il y a du pixel art. Mauvaise nouvelle : il ne bouge pas. Le contenu à droite peut être utilisé normalement, mais la palette de couleurs est incorrecte après le passage en mode nuit.

Claude Sonnet 4 : Celui-ci est un désastre. Il n'y a pas de pixel art, et même l'état de sélection des boutons est manquant. Les curseurs ne sont que des points ; autant utiliser les composants par défaut.

Gemini 2.5 Pro : Signale également une erreur en l'absence de grille de pixels. Le contenu du côté droit peut être utilisé normalement et le changement de thème fonctionne correctement, mais les composants par défaut sont un peu disgracieux.

Test 3 : Outil d'extraction de dégradé de couleurs d'image

Il s'agit d'un outil que j'ai développé précédemment. La logique n'est pas décrite en détail, mais le style est plus détaillé. Sa fonction principale est d'extraire cinq jeux de dégradés de couleurs d'une image.

Invite : Générez une page Web HTML à partir du contenu du fichier suivant, prenez en charge l'extraction de cinq jeux de dégradés de couleurs à partir des images téléchargées et permettez aux utilisateurs de copier directement ces cinq jeux de dégradés hexadécimaux. La fonction d'extraction des couleurs doit être implémentée.

  1. Utilisez la conception visuelle de style NetEase Cloud Music, un arrière-plan blanc avec une couleur similaire à #FE1110 comme point culminant
  2. Privilégiez les grandes polices ou les chiffres pour mettre en valeur les points clés. Intégrez des éléments visuels surdimensionnés pour mettre en valeur les zones d'intérêt et créer un contraste avec les éléments plus petits.
  3. Mélangez du texte chinois et anglais. Utilisez des caractères chinois gras et de grande taille, ainsi que du texte anglais plus petit comme accents.
  4. Utilisez des graphiques simples dessinés au trait pour la visualisation des données ou comme éléments décoratifs.
  5. Utilisez le dégradé de transparence des couleurs de surbrillance pour créer un effet inspiré de la technologie, mais assurez-vous que les différentes couleurs de surbrillance ne se mélangent pas les unes aux autres.
  6. Imitez les animations du site Web officiel d'Apple, avec des animations déclenchant le défilement de la souris
  7. Les données peuvent être référencées à partir de composants de graphiques en ligne, avec des styles cohérents avec le thème
  8. Utiliser Framer Motion (via CDN)
  9. Utilisez HTML5, TailwindCSS 3.0+ (via CDN) et JavaScript nécessaire
  10. Utilisez des bibliothèques d'icônes professionnelles telles que Font Awesome ou Material Icons (via CDN)
  11. Évitez d’utiliser les émojis comme icônes principales
  12. Le bouton capsule dans le coin inférieur gauche affiche le pseudo Twitter de l'auteur

Dans ce cas précis, Claude a fait un excellent travail. Les détails et l'esthétique des pages de Deepseek-R1-0528 sont impressionnants, mais la fonctionnalité n'est pas implémentée. Les pages d'Opus 4 et de Sonnet 4 sont plus simples, mais au moins fonctionnelles, tandis que Gemini ne l'est pas du tout.

Deepseek-R1-0528 : Après avoir réutilisé mon invite, l'esthétique de la page de Deepseek est vraiment incomparable. Il a également ajouté beaucoup de contenu optimisé pour le référencement, comme des scénarios d'application et des temps de traitement. Les cartes d'affichage en dégradé de couleurs sont également très détaillées, mais la logique de sélection des couleurs n'est pas implémentée.

Claude Opus 4 : Cette fois, Claude n'a finalement pas déçu en complétant les fonctionnalités de la page. Cependant, le contenu est très basique, avec seulement un emplacement pour télécharger les images et les résultats, et la logique de sélection des couleurs est également médiocre. Cependant, au moins, ça fonctionne.

Claude Sonnet 4 : Sonnet 4 a également complété la fonctionnalité, et je pense même que les résultats de Sonnet sont meilleurs que ceux d'Opus, même s'il n'est toujours pas aussi riche que Deepseek.

Gemini 2.5 Pro : Celui-ci est le pire. Non seulement les détails et l'esthétique de la page manquent, mais la fonctionnalité n'est pas implémentée non plus et l'application plante au démarrage.

Test 4 : Site Web de citations quotidiennes sur le bruit blanc

Next est un générateur de bruit blanc quotidien, idéal pour une extension de page d'accueil. Il prend en charge la lecture de bruit blanc depuis Spotify et affiche la page web.

Invite : Veuillez m'aider à créer un site Web de citations quotidiennes simple et élégant avec les exigences suivantes :

Conception visuelle

  • Image d'arrière-plan: Sélectionnez au hasard des images de paysage de haute qualité à partir des liens suivants comme image d'arrière-plan
  • Liens d'images: XXXX
  • Traitement d'image: Ajoutez un masque noir 25% et un léger flou gaussien pour garantir que le texte reste clair et lisible
  • Style général: Minimaliste et moderne, avec des images de paysage comme arrière-plan de la page Web pour améliorer l'immersion
  • Utilisez anime.js (introduit via CDN : JsDelivr jsdelivr.com) pour le framework d'animation, HTML5, TailwindCSS 3.0+ (introduit via CDN) et JavaScript nécessaire, et utilisez des bibliothèques d'icônes professionnelles telles que Font Awesome ou Material Icons (introduites via CDN).

Module d'affichage de l'heure

  • Haut:Afficher le format du mois et du jour (par exemple, « 29 mai »), dans une police plus petite, centrée
  • Deuxième rangée: Affiche le format « Semaine X · Calendrier lunaire Xe mois Xe jour » dans une police plus petite
  • Centre: Met en évidence la date actuelle en grande police blanche, centrée

Module d'affichage des devis

  • Contenu:Affiche aléatoirement des citations classiques de philosophes et d'écrivains chinois et étrangers
  • Mise en page:Les citations sont centrées, la taille de la police est modérée et l'espacement des lignes est confortable
  • Attribution: « Écrivain, XXX » ou « Philosophe, XXX » s'affiche en bas à droite
  • Bibliothèque de citations:Contient des citations sur divers sujets tels que la motivation, les perspectives de vie et la sagesse

Fonction de lecture de musique

  • Emplacement: Coin inférieur gauche de la page, réduit par défaut
  • Contenu: Intégrer la playlist de bruit blanc Spotify
  • Code:

Mise en œuvre technique

  • Conception réactive:Adapté aux ordinateurs de bureau et aux appareils mobiles
  • Sélection de polices:Utilisez des polices chinoises élégantes, introduites par Google Fonts
  • Schéma de couleurs:Utilisez principalement du texte blanc pour assurer la lisibilité sur tous les arrière-plans
  • Optimisation du chargement: Chargement paresseux des images pour améliorer les performances de la page

Fonctionnalités interactives

  • Actualisation automatique:Modifie automatiquement l'image d'arrière-plan et la citation tous les jours
  • Actualisation manuelle: Fournit un bouton d'actualisation pour permettre aux utilisateurs de modifier manuellement le contenu

Style de rédaction

  • Sélection de citations:Préférez les citations courtes, positives et philosophiques
  • Style de langue:Concis et puissant, évitant les longueurs excessives
  • Classification des thèmes: Des aperçus de vie, une croissance inspirante, des pensées sages, une expression émotionnelle, etc.

Veuillez générer un site Web HTML/CSS/JavaScript complet conformément aux exigences ci-dessus, en vous assurant que l'interface est esthétiquement agréable, fonctionnelle et offre une bonne expérience utilisateur.

Ce test vise uniquement à évaluer la compréhension de l'esthétique par chaque modèle. Ce type de page web orientée affichage est généralement réalisable.

Il faut dire que Claude Opus 4 fait toujours autorité dans ce domaine, avec un excellent souci du détail. Gemini 2.5 Pro est également performant, ajoutant même des effets d'animation aux transitions d'images. Deepseek et Sonnet 4 sont du même niveau.

Deepseek-R1-0528 : J'ai d'abord lancé Deepseek et je l'ai trouvé déjà plutôt bien. Le premier problème esthétique concernait le bouton de musique en bas à gauche, un peu trop plat. La section citation présentait également des problèmes : le masque noir n'aurait pas dû être ajouté et l'alignement du texte était un peu décalé. Cependant, un effet d'animation a été ajouté pour l'actualisation.

Claude Opus 4 : L'esthétique d'Opus 4 est vraiment impeccable. La taille et l'espacement des polices sont très confortables, et les citations des dictons célèbres ont été traitées avec transparence, tant pour le texte que pour les guillemets. Même le lecteur Spotify a été intégré à une interface utilisateur avec une animation de développement/réduction. C'est parfait.

Claude Sonnet 4 : L'effet de Sonnet 4 est similaire à celui de Deepseek. Le bouton de lecture de musique, la taille du texte, l'alignement et l'espacement peuvent tous être optimisés.

Gemini 2.5 Pro : L'effet Gemini est également satisfaisant, mais la suppression de l'ombre du texte serait plus efficace. L'interface du lecteur Spotify a également été personnalisée, et les détails du texte sont corrects. L'effet de transition est perceptible, avec un effet d'étirement sur l'image.

Test 5 : Génération de la page de l'application Sleep

Vient ensuite le test de l'application mobile. Demandez à chacun de créer une application de surveillance du sommeil. L'invite précisera la pile technique et les exigences de conception, et nécessitera la génération de plusieurs pages interactives.

Invite : Exigences de développement d'une application de surveillance du sommeil

Aperçu du projet

Aidez-moi à créer une application complète de suivi du sommeil avec quatre pages fonctionnelles principales. L'interface doit être esthétique et professionnelle.

Exigences de la pile technique

Technologies front-end

HTML5 – Structure de la page

TailwindCSS v3.0+ – Cadre de style (introduit via CDN)

JavaScript – Logique d’interaction nécessaire

Anime.js v4.0.2 – Bibliothèque d’effets d’animation

  • CDN: https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm

Icônes et graphiques

  • Bibliothèque d'icônes : Font Awesome ou Material Icons (CDN)
  • Composants du graphique : composants du graphique en ligne, les styles doivent être cohérents avec le thème
  • Visualisation des données : prend en charge l'affichage graphique des données de sommeil

Exigences de conception

Conception réactive

  • Mise en page entièrement réactive
  • Conception axée sur le mobile
  • Bon affichage sur les ordinateurs de bureau et les appareils mobiles

Effets d'interaction

  • Interaction des boutons : effet légèrement agrandi au survol

Interaction du formulaire : afficher une bordure dégradée lorsque le champ de saisie est sélectionné

Interaction de la carte : Assombrir l'ombre lors du survol

Effets d'animation : utilisez Anime.js pour obtenir des animations de page fluides

Exigences de la page fonctionnelle

Veuillez générer toutes les pages requises pour une application de surveillance du sommeil, y compris, mais sans s'y limiter :

  • Page d'accueil/tableau de bord
  • Page d'enregistrement du sommeil
  • Page d'analyse des données
  • Page des paramètres
  • Autres pages fonctionnelles connexes

Exigences de sortie du code

  • Chaque page est un fichier HTML indépendant
  • Structure de code claire avec commentaires complets
  • Assurez-vous que tous les liens CDN sont accessibles
  • Fournir un code complet et exécutable

En termes de logique et d'interface mobile, Cluade Opus 4 a une fois de plus démontré sa puissance, complétant plusieurs pages avec une logique performante. Les autres modèles ne généraient qu'une seule page, mais Deepseek R1 0528 a soudainement atteint un niveau esthétique exceptionnel, avec un style magnifique. Bien qu'il n'ait généré qu'une seule page, il était très complet.

Deepseek-R1-0528 : Une seule page a été générée, mais l'esthétique générale est satisfaisante. Les détails des cartes et la gestion des icônes sont soignés, et la page entière est complète et longue. De plus, un design adaptatif a été implémenté pour la navigation, ce qui permet des mises en page totalement différentes sur mobile et ordinateur.

Claude Opus 4 : Effectivement puissant, seul Opus4 a généré toutes les pages complètement, mais le design esthétique cette fois n'est pas génial, utilisant la logique de page Web, avec des icônes de navigation trop petites.

Claude Sonnet 4 : Je n'ai généré qu'une seule page et signalé des erreurs, avec une conception esthétique médiocre, en terminant simplement la tâche.

Gemini 2.5 Pro : Google fait toujours les choses différemment. Il génère chaque page individuellement, fournissant quatre fichiers qui ne peuvent pas interagir entre eux. De plus, toutes les pages signalaient des erreurs, chacune contenant uniquement de la navigation et aucun contenu, ce qui est assez décevant.

Test 6 : Fonctionnalités complexes — Tetris

Finalement, j'ai terminé avec un petit test de jeu. J'ai conçu un jeu Tetris relativement complexe avec des blocs spéciaux, un changement de thème, une prédiction d'atterrissage de blocs, un stockage de blocs et plus encore - un véritable défi ultime.

Invite : Aidez-moi à créer un jeu Web Tetris entièrement fonctionnel et visuellement attrayant avec les exigences suivantes :

Fonctionnalités principales du jeu

  1. Mécanisme complet de Tetris: 7 blocs standards (I, O, T, S, Z, J, L)
  2. Contrôles fluides: mouvement gauche et droite, rotation, chute rapide, chute instantanée
  3. Système d'élimination intelligent: prend en charge l'élimination de 1 à 4 lignes à la fois avec des effets d'animation spéciaux
  4. Système de difficulté progressif: augmente automatiquement la vitesse et le niveau de chute en fonction du nombre de lignes éliminées

Fonctionnalités avancées

  1. Système de prévisualisation: affiche les blocs suivants et suivants
  2. Fonction de maintienMaintenez la touche Hold enfoncée pour enregistrer temporairement le bloc actuel. Utilisable une seule fois par tour.
  3. Blocs fantômes: Affiche la position d'atterrissage des blocs sous forme semi-transparente
  4. Système combiné:Le nettoyage continu accorde des points supplémentaires et des effets visuels
  5. Compétences spéciales:
    1. Blocage de bombes (nettoie la zone environnante)
    2. Laser Clear (efface toute la rangée)
    3. Pause temporelle (les blocs cessent de tomber pendant 3 secondes)

Exigences de conception visuelle

  1. Interface utilisateur moderne:
    1. Fond dégradé ou effets de particules
    2. Panneau de jeu effet verre
    3. Transitions d'animation fluides
    4. Conception réactive pour différents écrans
  2. Effets visuels riches:
    1. Animation fluide des blocs tombant et tournant
    2. Effets d'explosion ou de flash lors de l'élimination
    3. Effet de tremblement de l'écran lorsque le combo est réalisé
    4. Animation de célébration lorsque le niveau est amélioré
  3. Système de thèmes:Au moins 3 thèmes visuels différents entre lesquels basculer

Système d'effets sonores

  1. Retour sonore complet: mouvement, rotation, atterrissage, élimination, fin de partie, etc.
  2. Musique de fond: BGM du jeu en boucle
  3. Contrôle du volume: effets sonores et volume de la musique de fond réglables indépendamment

Modes de jeu

  1. Mode classique: gameplay traditionnel de Tetris
  2. Mode limité dans le temps: atteindre le score le plus élevé dans un délai spécifié
  3. Mode défi: obstacles prédéfinis pour augmenter la difficulté
  4. Mode Zen:pas de pression temporelle, pur plaisir du jeu

Fonctionnalités des statistiques de données

  1. Statistiques en temps réel: score actuel, niveau, nombre de lignes franchies, temps de jeu
  2. Histoire: score le plus élevé, meilleur niveau, temps de jeu total
  3. Système de réussite: débloquer divers succès de jeu
  4. Stockage local: enregistrer les enregistrements et les paramètres du jeu

Exigences techniques

  1. Utilise du HTML5/CSS3/JavaScript pur, aucun cadre externe requis
  2. Structure de code claire: programmation orientée objet, conception modulaire
  3. Optimisation des performances: animation fluide à 60 FPS, sans décalage
  4. Compatibilité: prend en charge les principaux navigateurs modernes
  5. Conception réactive: Compatible avec les PC et les appareils mobiles

Expérience utilisateur

  1. Instructions intuitives: Tutoriel intégré et invites de boutons
  2. Fonction pause/reprise: Mettez le jeu en pause à tout moment
  3. Menu des paramètres: Ajustez la difficulté du jeu, les effets sonores, les effets visuels, etc.
  4. Sauvegarde de l'état du jeu: Prend en charge la sauvegarde et la reprise du jeu

Exigences de qualité du code

  1. Commentaires détaillés: Chaque fonction et segment de code important doit avoir une description
  2. Gestion des erreurs: Mécanisme complet de capture et de gestion des exceptions
  3. Code élégant:Suivez les meilleures pratiques, faciles à comprendre et à entretenir
  4. Extensibilité:Facile d'ajouter de nouvelles fonctionnalités à l'avenir

Veuillez fournir des fichiers HTML complets contenant l'intégralité du code CSS et JavaScript afin de garantir leur exécution directe dans un navigateur. Le code doit démontrer des compétences professionnelles en programmation et une compréhension approfondie du développement de jeux.

Dans le mini-jeu, Claude a une idée en tête. Opus et Sonnet ont tous deux généré les blocs Tetris correspondants, notamment la logique des blocs spéciaux. Deepseek a traité le thème que Claude avait négligé, mais a omis les blocs spéciaux, ce qui a conduit Gemini 2.5 Pro à générer des blocs injouables.

Deepseek-R1-0528 : La tâche a été réalisée avec brio et conformément aux spécifications, mais la conception spéciale des blocs a été omise et n'a pas été implémentée. Cela peut être dû à des difficultés à suivre les instructions. La page web entière ressemble à une interface de jeu, avec tous les boutons apparaissant comme des composants standard.

Claude Opus 4 : La logique des blocs spéciaux et d'autres éléments logiques a été complétée sans problème, mais l'invite de changement de thème, qu'il n'a pas implémentée, a été ignorée. Comparé aux problèmes de DeepSeek, ce problème est mineur, mais l'interface est codée en dur et dépourvue de logique réactive. Les proportions sont donc légèrement décalées, rendant certains boutons inutilisables.

Claude Sonnet 4 : Similaire à Opus, mais je pense que Sonnet 4 est meilleur qu'Opus. L'adaptation des pages est également bonne. On dirait que Sonnet a gagné, car il a rempli toutes les fonctions requises.

Gemini 2.5 Pro : Gemini a constamment du mal avec la logique complexe. Cette fois, c'était complètement inutilisable, car le placement des briques présentait un bug, rendant impossible de prédire où elles atterriraient. C'est le pire.

À présent, je pense que vous êtes aussi étonné que moi par les performances du DeepSeek-R1.

Difficile de croire qu'il s'agit d'une simple mise à niveau. Comparons les prix de ces modèles avec le DeepSeek R1 0528.

L'Opus 4 est 30 fois plus cher, et ce, en utilisant les prix d'Openrouter. Le prix officiel serait encore plus stupéfiant.

modèleLongueur du contextePrix d'entrée ($/M jetons)Prix de sortie ($/M jetons)prix de l'image ($/K jetons)
DeepSeek R1 0528160 0000.502.18
Aperçu de Gemini 2.5 pro1000 0001.25105.16
Claude Sonnet 4200 0003.00154.80
Claude Opus 4200 00015.007524.00

En tant que spécialiste quotidien de l'actualité de l'IA, j'ai été témoin d'innombrables « avancées » qui se sont finalement révélées « décevantes ». Mais cette fois, c'est différent. DeepSeek-R1 m'a donné un réel espoir.

Une différence de prix de 30 fois, mais des performances presque équivalentes.

Nous n'avons plus besoin de payer des prix exorbitants pour utiliser les meilleurs modèles de programmation d'IA, ni de faire de compromis pénibles entre coût et qualité. Le plus inspirant, c'est qu'il s'agit de notre propre modèle.

Cette phrase a été écrite par l'IA, et je pense qu'elle est géniale : La véritable révolution commence souvent lorsque des gens ordinaires parviennent à atteindre les étoiles.

A lire également

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *