במהלך הימים האחרונים, Deepseek-R1 0528 הפך רשמית לקוד פתוח.

ב-LiveCodeBench, הביצועים שלו כמעט דומים ל-o3 (גבוה) של OpenAI; במבחן הרב-לשוני של Aider, הוא עומד במבחן מול קלוד אופוס.

כאשר הוא הושק באתר הרשמי, בדקנו במהירות את יכולות החזית שלו ומצאנו שהן חזקות במיוחד, מה שהוביל לבדיקות המכוסות במאמר זה. אנו שואפים לשתף אתכם בביצועים הספציפיים של דגמים שונים.

חשוב לציין שבדיקה זו מתמקדת בעיקר ביכולות של חזית הפרויקט, ולכן חיוני לבחון את ביצועי המודלים השונים בצורה אובייקטיבית. אתם יכולים להשתמש בהנחיות שאנו מספקים כדי לבצע בדיקות משלכם ולשתף את התובנות והממצאים שלכם.

באמצעות אותה הנחיה, שלחנו אותה ל-Claude Opus 4, Sonnet 4, Gemini 2.5 Pro, ו- DeepSeek R1-0528, והגישו להם התמודדות בשש משימות פיתוח חזיתיות מאתגרות יותר ויותר.

למי שלא יכול לחכות, הנה הסיכום:

Deepseek-R1-0528 מפגר מעט אחרי Opus 4 ביכולות חזיתיות אך מתפקד טוב יותר סונטה 4 וג'מיני 2.5 פרו.

בעיקרון, כל משימה שאופוס יכול להשלים, גם R1 יכול להשלים, ואפילו משימות שאופוס 4 לא יכול להשלים, R1 יכול להתמודד איתן, אם כי עם שיעורי השלמה ואיכות תוצאות מעט נמוכים יותר.

בהתחשב בהפרש המחירים בין R1 לשלושת האחרים, הביצועים האלה כבר מצוינים, ואנחנו יכולים רק לדמיין עד כמה R2 יהיה מרשים.

מבחן 1: מערכת ניהול מחסן

בקשה: אנא עזרו לי ליצור כלי ניהול מוצר מבוסס אינטרנט מלא עם הדרישות הבאות:

דרישות פונקציונליות

  1. ניהול מוצר
  • הזנת מידע על המוצרשם מוצר, סוג/קטגוריה, מספר מק"ט, מחיר, כמות במלאי
  • ניהול תמונות מוצרתמיכה בהעלאת תמונות ותצוגה מקדימה (מדומה באמצעות בורר קבצים)
  • תצוגת רשימת מוצריםהצג את כל המוצרים בפורמט טבלה, עם תמיכה בחיפוש וסינון
  • עריכת מוצרשינוי מידע על מוצר תמיכה
  • מחיקת מוצרתמיכה במחיקת מוצר (עם בקשת אישור)
  1. ניהול מלאי
  • פעולות נכנסותהגדלת כמות מלאי המוצרים, רישום זמן וכמות כניסה
  • פעולות יוצאות: הפחתת כמות מלאי המוצרים, רישום זמן וכמות של יציאה
  • רישומי מלאימציג את היסטוריית השינויים במלאי עבור כל מוצר
  1. תכונות ממשק
  • לוּחַ מַחווָנִיםמציג נתונים סטטיסטיים כגון מספר מוצרים כולל, ערך מלאי כולל, התראות על מלאי נמוך וכו'.
  • עיצוב רספונסיביניתן להתאמה למחשבים שולחניים ולמכשירים ניידים
  • עמידות נתוניםמשתמש באחסון מקומי לשמירת נתונים

דרישות טכניות

סגנונות וסמלים

  • מסגרת CSSמשתמש ב-TailwindCSS 3.0+ CDN
  • ספריית אייקוניםמשתמש באייקוני גיבורים או אייקוני נוצה CDN
  • גוֹפָןהשתמש בגוגל גופנים

מבנה הקוד

  • אפליקציה בת עמוד אחדHTML + CSS + ג'אווהסקריפט
  • עיצוב מודולריפירוק פונקציות למודולי JavaScript שונים
  • פורמט נתוניםהשתמש בפורמט JSON לאחסון נתוני מוצר

דרישות עיצוב ממשק

  • ממשק משתמש מודרניעיצוב ממשק פשוט ויפהפה
  • ערכת צבעיםהשתמשו בשילובי צבעים מקצועיים לעסקים
  • משוב אינטראקטיבילחיצות על כפתורים, אימות טפסים ואפקטים אינטראקטיביים אחרים
  • אימות טופסאימות שדות חובה, אימות פורמט נתונים

דוגמה למבנה נתונים

אנא צור קובץ HTML מלא המכיל את כל קוד ה-CSS וה-JavaScript הדרושים, וודא שכל התכונות פועלות ויכולות לפעול ישירות בדפדפן.

בואו נסתכל על תוצאות הבדיקה. הלוגיקה היא למעשה די מורכבת, ובוחנת את אורך ההקשר של המודל, את החוש האסתטי שלו ואת יכולות העיבוד הלוגי שלו.

במקרה זה, כל הדגמים מלבד Deepseek נכשלו. התרגום של קלוד 4 היה די לא בסדר, למען האמת.

דיפסיק-R1-0528: הגרסה המשודרגת של R1 חזקה מאוד. כפי שניתן לראות, הממשק מקצועי מאוד, וניתן גם ליצור מוצרים חדשים, לבצע פעולות יוצאות ונכנסות רגילות, ולחלק דוחות מוצרים, ניהול מלאי ומלאי לשלושה עמודים, וזה מאוד ברור בסך הכל. יש גם דף לוח מחוונים ייעודי, והוא כתב כמה נתוני דוגמה לבדיקה. למודלים האחרים אין נתונים, והוספת מוצרים לא עובדת, כך שהבדיקה בלתי אפשרית לחלוטין.

קלוד אופוס 4: זה מתחיל בממשק גדול, פשוט מאוד, המשתמש בסרגל ניווט עליון במקום בסרגל הצד הנפוץ בפלטפורמות SaaS. הוספת מוצרים גורמת לשגיאה בעת השמירה, מה שהופך את הבדיקה לבלתי אפשרית.

קלוד סונטה 4: בהשוואה ל-Opus 4, הממשק בסיסי אף יותר. לחיצה על כפתור "הוסף מוצר" לא מגיבה, ולא מופיע טופס קופץ. שאר הדפים הם למעשה רק מצייני מיקום.

ג'מיני 2.5 פרו: הגרסה של גוגל טובה יותר מזו של קלוד. היא מאפשרת הוספת מוצרים וריצות, אבל יש בה באגים. זה עבד כשניסיתי את זה לראשונה, אבל לא כשצילמתי סרטון. עם זאת, עיצוב האינטראקציה של ג'מיני די מורכב, עם ניהול מלאי ותיעוד כולם בטבלה אחת, מה שמוסיף קצת קושי.

מבחן 2: עורך אנימציית פיקסלים

הבא הוא מבחן של יכולת חזותית. ביקשתי מהם ליצור עורך אנימציה של פיקסל ארט באמצעות P5.js, תמיכה במצבי תנועה, התאמת צורות, גדלים, מהירויות ותנאים אחרים של נקודות.

בקשה: צור מחולל אנימציה אינטראקטיבי של פיקסלים במסך מלא המבוסס על P5.js, תוך עמידה בדרישות הטכניות הבאות:

תכונות ליבה

  • הטמע אנימציית פיקסלים במסך מלא באמצעות P5.js, כאשר האנימציה מכסה את כל אזור התצוגה.
  • השטח הכולל של רשת הפיקסלים חייב להיות לפחות פי 10 מהשטח הנראה כדי להבטיח כיסוי מלא אפילו במרווח הרשת הקטן ביותר.
  • מספקים מספר מצבי אנימציה: גל, דופק, אדווה, רעש
  • תמיכה באפשרויות צורת נקודה מרובות: עיגול, ריבוע, צלב, משולש, יהלום וכו'.
  • כל לוחות הבקרה ממוקמים בצד ימין של הדף וניתן לקפל אותם לתחתית במכשירים ניידים

פרמטרים מתכווננים

  • צפיפות נקודות: שליטה במספר הנקודות בכל שורה/עמודה
  • גודל צורה: התאם את גודל הנקודות
  • מהירות אנימציה: שלוט במהירות ובמשרעת של אפקט האנימציה
  • ריווח רשת: כוונן את המרחק בין נקודות

מפרט טכני

  • השתמשו ב-HTML5, ב-TailwindCSS 3.0+ (שהוצג דרך CDN) וב-P5.js
  • הטמע פונקציונליות מלאה של החלפת מצבים כהים/בהירים, כאשר ברירת המחדל היא הגדרות המערכת
  • הקוד חייב לכלול לוגיקת אופטימיזציה של ביצועים, תוך עיבוד נקודות רק בתוך האזור הנראה ובקרבת הקצוות.
  • אנימציות חייבות לפעול בצורה חלקה וללא השהיה

עיצוב רספונסיבי

  • הדפים חייבים להופיע בצורה מושלמת בכל המכשירים (נייד, טאבלט, מחשב שולחני)
  • לוחות הבקרה צריכים להיות ניתנים לקיפול/הרחבה בתצוגה ניידת
  • אופטימיזציה של הפריסה וגדלי הגופן עבור גדלי מסך שונים
  • הבטחת חוויית מגע טובה במכשירים ניידים

רכיבי ממשק

  • בורר מצבי אנימציה (גל, דופק, אדווה, רעש)
  • בורר צורות (מציג צורות שונות עם סמלים)
  • פקדי מחוון: צפיפות, גודל, מהירות, ריווח
  • כפתור החלפת ערכת נושא
  • הצגת מידע על שכבת המטריצה ומספר הנקודות הכולל

תסתכלו על התוצאות. למען האמת, לא ציפיתי שהדגמים האחרים יצליחו כל כך במבחן הזה. מלבד Deepseek-R1, האנימציות של הדגמים האחרים לא עבדו בכלל.

דיפסיק-R1-0528: ללא רבב. כל כפתור ומחוון פועלים כרגיל, והנקודות נעות בצורה חלקה. הוא אפילו הוסיף נתוני מטריצת נקודות, והצבעים נשארים עקביים לאחר המעבר למצב לילה. הבעיה הקטנה היחידה היא שיש בעיה קלה במצב בחירת הצבעים, אך זו זניחה בהשוואה לביצועים הגרועים של דגמים אחרים.

קלוד אופוס 4: חדשות טובות: יש לו אמנות פיקסלים. חדשות רעות: הוא לא זז. ניתן להפעיל את התוכן בצד ימין כרגיל, אך ערכת הצבעים שגויה לאחר המעבר למצב לילה.

קלוד סונטה 4: זה אסון. אין שום גרפיקה של פיקסלים, ואפילו מצב בחירת הכפתורים חסר. המחוונים הם רק נקודות - אפשר באותה מידה להשתמש ברכיבים המוגדרים כברירת מחדל.

ג'מיני 2.5 פרו: מדווח גם על שגיאה ללא רשת פיקסלים. ניתן להפעיל את התוכן בצד ימין כרגיל, והחלפת ערכות נושא עובדת בסדר, אך רכיבי ברירת המחדל מעט מכוערים.

מבחן 3: כלי לחילוץ צבעי גרדיאנט של תמונה

זה כלי שכתבתי עליו קודם. אין הרבה תיאור של הלוגיקה, אבל יש יותר תיאור של הסגנון. הפונקציה העיקרית היא לחלץ חמש קבוצות של צבעי גרדיאנט מתמונה.

בקשה: צור דף אינטרנט HTML המבוסס על תוכן הקובץ הבא, תמיכה בחילוץ חמש קבוצות של צבעי גרדיאנט מתמונות שהועלו, ואפשר למשתמשים להעתיק ישירות את חמש קבוצות צבעי הגרדיאנט ההקסדצימליים. יש ליישם את פונקציית חילוץ הצבעים.

  1. השתמש בעיצוב חזותי בסגנון NetEase Cloud Music, רקע לבן עם צבע דומה ל-#FE1110 כנקודת השיא
  2. הדגישו גופנים או מספרים גדולים כדי להדגיש נקודות מפתח. כללו אלמנטים חזותיים גדולים במיוחד כדי להדגיש אזורי מיקוד, וליצור ניגודיות עם אלמנטים קטנים יותר.
  3. ערבבו טקסט בסינית ובאנגלית. השתמשו בתווים סיניים גדולים ומודגשים ובטקסט קטן יותר באנגלית כדגשים.
  4. השתמש בגרפיקה פשוטה המצוירת בקווים לצורך ויזואליזציה של נתונים או כאלמנטים דקורטיביים.
  5. השתמשו בגרדיאנט שקיפות של צבעי הדגש כדי ליצור אפקט בהשראת טכנולוגיה, אך ודאו שצבעי הדגש שונים לא יתמזגו זה עם זה.
  6. חיקוי אנימציות של אתר האינטרנט הרשמי של אפל, כאשר גלילה עם העכבר מפעילה אנימציות
  7. ניתן להפנות נתונים מרכיבי תרשים מקוונים, עם סגנונות התואמים את הנושא
  8. השתמש בתנועת Framer (דרך CDN)
  9. השתמשו ב-HTML5, ב-TailwindCSS 3.0+ (דרך CDN) וב-JavaScript הנדרש
  10. השתמשו בספריות אייקונים מקצועיות כמו Font Awesome או Material Icons (דרך CDN)
  11. הימנעו משימוש באמוג'ים כסמלים עיקריים
  12. כפתור הקפסולה בפינה השמאלית התחתונה מציג את שם המשתמש של המחבר בטוויטר

במקרה הזה, קלוד סוף סוף עשה עבודה נהדרת. פרטי העמוד והאסתטיקה של Deepseek-R1-0528 מרשימים, אבל הפונקציונליות לא מיושמת. עמודי Opus 4 ו-Sonnet 4 פשוטים יותר אבל לפחות פונקציונליים, בעוד ש-Gemini אינו פונקציונלי כלל.

דיפסיק-R1-0528: אחרי שהשתמשתי שוב בהנחיה שלי, האסתטיקה של הדף של Deepseek היא ללא תחרות. הוא גם הוסיף הרבה תוכן ידידותי לקידום אתרים (SEO) לדף, כגון תרחישי יישום וזמני עיבוד. כרטיסי התצוגה בצבעי גרדיאנט גם הם מפורטים מאוד, אך לוגיקת בחירת הצבעים אינה מיושמת.

קלוד אופוס 4: הפעם, קלוד סוף סוף לא אכזב, והשלים את פונקציונליות הדף, אבל תוכן הדף בסיסי מאוד, עם רק מקום להעלאת תמונות ותוצאות, וגם ההיגיון של בחירת הצבעים גרוע. עם זאת, זה לפחות עובד.

קלוד סונטה 4: גם סונט 4 השלימה את הפונקציונליות, ואני אפילו חושב שהתוצאות של סונט טובות יותר מאלה של אופוס, אם כי היא עדיין לא עשירה כמו דיפסיק.

ג'מיני 2.5 פרו: זה הכי גרוע. לא רק שפרטי הדף והאסתטיקה לוקים בחסר, אלא שגם הפונקציונליות לא מיושמת, והוא קורס בהפעלה.

מבחן 4: אתר אינטרנט של ציטוט יומי של רעש לבן

הבא בתור הוא מחולל ציטוט יומי של רעש לבן, שהוא מושלם לתוסף של דף כרטיסייה חדשה. הוא תומך בהשמעת רעש לבן מספוטיפיי, ודף האינטרנט מוצג.

בקשה: אנא עזרו לי ליצור אתר אינטרנט פשוט ואלגנטי להצעות מחיר יומיות, עם הדרישות הבאות:

עיצוב חזותי

  • תמונת רקעבחרו באופן אקראי תמונות נוף באיכות גבוהה מהקישורים הבאים כתמונת רקע
  • קישורי תמונה: XXXX
  • עיבוד תמונההוסף מסכה שחורה 25% וטשטוש גאוסי קל כדי להבטיח שהטקסט יישאר ברור וקריא
  • סגנון כללימינימליסטי ומודרני, עם תמונות נוף כרקע של דף האינטרנט כדי לשפר את הסוחף
  • השתמשו ב-anime.js (שהוצג דרך CDN: JsDelivr jsdelivr.com) עבור מסגרת האנימציה, HTML5, TailwindCSS 3.0+ (שהוצג דרך CDN), ו-JavaScript הכרחי, והשתמשו בספריות אייקונים מקצועיות כגון Font Awesome או Material Icons (שהוצגו דרך CDN).

מודול תצוגת זמן

  • רֹאשׁ: הצגת פורמט החודש והיום (לדוגמה, "29 במאי"), בגופן קטן יותר, במרכז
  • שורה שנייהמציג את הפורמט "שבוע X · לוח שנה ירחי חודש X יום X" בגופן קטן יותר
  • מֶרְכָּז: מדגיש את התאריך הנוכחי בגופן לבן גדול, במרכז

מודול תצוגת הצעות מחיר

  • תוֹכֶןמציג באופן אקראי ציטוטים קלאסיים של פילוסופים וסופרים סינים וזרים
  • מַעֲרָךציטוטים ממורכזים, גודל הגופן בינוני וריווח השורות נוח
  • שִׁיוּך: "סופר, XXX" או "פילוסוף, XXX" מוצגים בפינה הימנית התחתונה
  • ספריית ציטוטיםמכיל ציטוטים בנושאים שונים כגון מוטיבציה, תובנות חיים וחוכמה

פונקציית השמעת מוזיקה

  • מִקוּםהפינה השמאלית התחתונה של הדף, מכווץ כברירת מחדל
  • תוֹכֶןהטמעת רשימת השמעה של רעש לבן בספוטיפיי
  • קוד:

יישום טכני

  • עיצוב רספונסיבימותאם למחשבים שולחניים ולמכשירים ניידים
  • בחירת גופןהשתמשו בגופנים סיניים אלגנטיים, שהוצגו על ידי גוגל פונטס
  • ערכת צבעיםהשתמשו בעיקר בטקסט לבן כדי להבטיח קריאות על כל הרקעים
  • אופטימיזציה של טעינהטעינה עצלה של תמונות לשיפור ביצועי הדף

תכונות אינטראקטיביות

  • רענון אוטומטי: משנה אוטומטית את תמונת הרקע והציטוט בכל יום
  • רענון ידנימספק כפתור רענון המאפשר למשתמשים לשנות את התוכן באופן ידני

סגנון קופירייטינג

  • בחירת ציטוטמעדיפים ציטוטים קצרים, חיוביים ופילוסופיים
  • סגנון שפהתמציתי ועוצמתי, תוך הימנעות מאורכות יתר
  • סיווג נושאיםתובנות חיים, צמיחה מעוררת השראה, מחשבות חכמות, ביטוי רגשי וכו'.

אנא צור אתר HTML/CSS/JavaScript מלא בהתאם לדרישות הנ"ל, תוך הקפדה על ממשק נעים מבחינה אסתטית, פונקציונלי ומספק חוויית משתמש טובה.

בדיקה זו נועדה אך ורק להעריך את הבנתו של כל דוגמן את האסתטיקה. דף אינטרנט מסוג זה המכוון לתצוגה ניתן בדרך כלל להשגה.

יש לציין ש-Claude Opus 4 עדיין די סמכותי בתחום הזה, עם תשומת לב מצוינת לפרטים. גם Gemini 2.5 Pro טוב, אפילו מוסיף אפקטים של אנימציה למעברי תמונה. Deepseek ו-Sonnet 4 באותה רמה.

דיפסיק-R1-0528: הפעלתי קודם את Deepseek וחשבתי שהוא כבר די טוב. הבעיה הראשונה עם האסתטיקה הכללית הייתה כפתור המוזיקה בפינה השמאלית התחתונה, שהיה קצת שטוח מדי. גם בחלק הציטוטים היו בעיות - המסכה השחורה לא הייתה צריכה להיות מוסיפה, ויישור הטקסט היה קצת לא בסדר. עם זאת, הוא הוסיף אפקט אנימציה לרענון.

קלוד אופוס 4: האסתטיקה של Opus 4 היא ללא רבב. הגודל והריווח של כל הגופנים נוחים מאוד, והציטוטים של האמרות המפורסמות טופלו בשקיפות הן עבור טקסט הציטוט והן עבור המרכאות. אפילו נגן Spotify עטוף בממשק משתמש עם אנימציית הרחבה/צמצום. זה מושלם.

קלוד סונטה 4: האפקט של Sonnet 4 דומה לבעיה של Deepseek. ניתן לייעל עוד יותר את כפתור השמעת המוזיקה, גודל הטקסט, היישור והריווח.

ג'מיני 2.5 פרו: האפקט של Gemini גם הוא טוב, אבל הסרת צל הטקסט הייתה משפרת אותו. הוא גם ביצע התאמה אישית של ממשק המשתמש של נגן Spotify, ופרטי הטקסט בסדר. אפקט המעבר מורגש, עם אפקט מתיחה על התמונה.

מבחן 5: יצירת דף אפליקציית שינה

הבא בתור הוא בדיקת האפליקציה לנייד. בקשו מכל אחד מהם ליצור אפליקציית ניטור שינה. ההנחיה תפרט את דרישות העיצוב והסטנדרט הטכני, ותדרוש יצירת מספר דפים אינטראקטיביים.

בקשה: דרישות פיתוח אפליקציית ניטור שינה

סקירת הפרויקט

אנא עזרו לי ליצור אפליקציית ניטור שינה מלאה עם ארבעה עמודים פונקציונליים עיקריים. הממשק צריך להיות אסתטי ונעים לעין ומקצועי.

דרישות טכניות של מחסנית

טכנולוגיות Frontend

HTML5 – מבנה העמוד

TailwindCSS גרסה 3.0+ – מסגרת סגנון (הוצגה דרך CDN)

ג'אווהסקריפט – היגיון אינטראקציה הכרחי

Anime.js גרסה 4.0.2 – ספריית אפקטים של אנימציה

  • רשת מדיה חברתית: https://cdn.jsdelivr.net/npm/animejs@4.0.2/+esm

סמלים ותרשימים

  • ספריית אייקונים: Font Awesome או Material Icons (CDN)
  • רכיבי תרשים: רכיבי תרשים מקוונים, סגנונות חייבים להיות עקביים עם הנושא
  • ויזואליזציה של נתונים: תומך בתצוגת תרשימים של נתוני שינה

דרישות עיצוב

עיצוב רספונסיבי

  • פריסה רספונסיבית לחלוטין
  • עיצוב ממוקד במובייל
  • תצוגה טובה גם במחשבים שולחניים וגם במכשירים ניידים

השפעות אינטראקציה

  • אינטראקציית כפתור: אפקט מוגדל מעט בעת ריחוף

אינטראקציה עם טופס: הצגת גבול הדרגתי כאשר שדה הקלט נמצא במוקד

אינטראקציה עם כרטיס: להכהות את הצל בעת ריחוף

אפקטים של אנימציה: השתמשו ב-Anime.js כדי להשיג אנימציות חלקות של העמוד

דרישות דף פונקציונליות

אנא צור את כל הדפים הנדרשים עבור אפליקציית ניטור שינה, כולל אך לא רק:

  • דף הבית/לוח מחוונים
  • דף רישום שינה
  • דף ניתוח נתונים
  • דף ההגדרות
  • דפים פונקציונליים קשורים אחרים

דרישות פלט קוד

  • כל עמוד הוא קובץ HTML עצמאי
  • מבנה קוד ברור עם הערות מלאות
  • ודא שכל קישורי ה-CDN נגישים
  • ספק קוד מלא וניתן להרצה

מבחינת לוגיקה וממשק נייד, Cluade Opus 4 הוכיח שוב את כוחו, והשלים מספר עמודים עם לוגיקה טובה. הדגמים האחרים יצרו רק עמוד אחד, אבל Deepseek R1 0528 פתאום קלע בול מבחינת אסתטיקה, עם סגנון יפהפה. למרות שיצר רק עמוד אחד, הוא היה שלם מאוד.

דיפסיק-R1-0528: יצרנו רק עמוד אחד, אבל האסתטיקה הכללית טובה. פרטי הכרטיסים והטיפול באייקונים נעשו היטב, והעמוד כולו שלם וארוך. בנוסף, יושם עיצוב רספונסיבי לניווט, וכתוצאה מכך פריסות שונות לחלוטין במכשירים ניידים ומחשבים שולחניים.

קלוד אופוס 4: אכן עוצמתי, רק Opus4 יצר את כל הדפים במלואם, אבל העיצוב האסתטי הפעם לא נהדר, תוך שימוש בלוגיקת דפי אינטרנט, עם סמלי ניווט קטנים מדי.

קלוד סונטה 4: יצר רק דף אחד ודיווח על שגיאות, עם עיצוב אסתטי גרוע, תוך השלמת המשימה.

ג'מיני 2.5 פרו: גוגל תמיד עושה דברים בצורה שונה. היא מייצרת כל עמוד בנפרד, ומספקת ארבעה קבצים שלא יכולים לתקשר זה עם זה. בנוסף, כל העמודים דיווחו על שגיאות, כאשר כל עמוד הכיל רק ניווט וללא תוכן, וזה די מאכזב.

מבחן 6: פונקציונליות מורכבת - טטריס

לבסוף, סיימתי עם מבחן משחק קטן. עיצבתי משחק טטריס מורכב יחסית עם בלוקים מיוחדים, החלפת נושאים, חיזוי נחיתת בלוקים, אחסון בלוקים ועוד - אתגר אולטימטיבי אמיתי.

בקשה: אנא עזרו לי ליצור משחק טטריס אינטרנטי פונקציונלי לחלוטין ומושך ויזואלית, עם הדרישות הבאות:

תכונות משחק מרכזיות

  1. מנגנון טטריס שלם7 בלוקים סטנדרטיים (I, O, T, S, Z, J, L)
  2. בקרות חלקותתנועה ימינה ושמאלה, סיבוב, ירידה מהירה, ירידה מיידית
  3. מערכת חיסול חכמהתומך בהסרת 1-4 שורות בכל פעם עם אפקטים מיוחדים של אנימציה
  4. מערכת קושי מתקדמת: מגביר אוטומטית את מהירות הירידה והרמה בהתבסס על מספר השורות שהוסרו

תכונות מתקדמות

  1. מערכת תצוגה מקדימהמציג את הבלוקים הבאים והבלוקים הבאים-הבאים
  2. פונקציית החזקה: החזק את מקש ההחזקה לחוץ כדי לאחסן באופן זמני את הבלוק הנוכחי. ניתן להשתמש בו פעם אחת בלבד בכל סיבוב
  3. בלוקי רפאיםמציג את מיקום הנחיתה של בלוקים בצורה שקופה למחצה
  4. מערכת קומבוניקוי רציף מעניק נקודות נוספות ואפקטים חזותיים
  5. מיומנויות מיוחדות:
    1. בלוק פצצות (מנקה את האזור שמסביב)
    2. לייזר ניקוי (מנקה את כל השורה)
    3. השהיית זמן (בלוקים מפסיקים ליפול למשך 3 שניות)

דרישות עיצוב חזותי

  1. ממשק משתמש מודרני:
    1. רקע גרדיאנט או אפקטים של חלקיקים
    2. פאנל משחק עם אפקט זכוכית
    3. מעברים חלקים באנימציה
    4. עיצוב רספונסיבי למסכים שונים
  2. אפקטים חזותיים עשירים:
    1. אנימציה חלקה של בלוקים נופלים ומסתובבים
    2. אפקטים של פיצוץ או הבזק לאחר ביטול
    3. אפקט רעידת המסך בעת השגת קומבו
    4. אנימציית חגיגה לאחר שדרוג הרמה
  3. מערכת ערכות נושאלפחות 3 ערכות נושא חזותיות שונות למעבר ביניהן

מערכת אפקטים קוליים

  1. משוב קולי מלא: תנועה, סיבוב, נחיתה, חיסול, סיום משחק וכו'.
  2. מוזיקת רקע: רקע רקע של המשחק בלולאה
  3. בקרת עוצמת קולאפקטים קוליים ועוצמת מוזיקת רקע הניתנים להתאמה עצמאית

מצבי משחק

  1. מצב קלאסימשחק טטריס מסורתי
  2. מצב מוגבל בזמן: להשיג את הציון הגבוה ביותר בתוך מגבלת זמן מוגדרת
  3. מצב אתגרמכשולים מוגדרים מראש להגברת הקושי
  4. מצב זןאין לחץ זמן, הנאה צרופה מהמשחק

תכונות סטטיסטיקות נתונים

  1. סטטיסטיקות בזמן אמת: תוצאה נוכחית, רמה, מספר שורות שנמחקו, זמן משחק
  2. הִיסטוֹרִיָה: הציון הגבוה ביותר, הרמה הטובה ביותר, זמן משחק כולל
  3. מערכת הישגים: פתחו הישגים שונים במשחק
  4. אחסון מקומישמירת רשומות והגדרות משחק

דרישות טכניות

  1. משתמש ב-HTML5/CSS3/JavaScript טהורים, אין צורך במסגרות חיצוניות
  2. מבנה קוד ברורתכנות מונחה עצמים, עיצוב מודולרי
  3. אופטימיזציה של ביצועיםאנימציה חלקה של 60 פריימים לשנייה, ללא השהיה
  4. תְאִימוּתתומך בדפדפנים מודרניים נפוצים
  5. עיצוב רספונסיביתואם למחשבים אישיים ולמכשירים ניידים

חוויית משתמש

  1. הוראות אינטואיטיביותהדרכה מובנית והנחיות כפתור
  2. פונקציית השהיה/חידוש: השהה את המשחק בכל עת
  3. תפריט הגדרות: התאמת רמת קושי המשחק, אפקטים קוליים, אפקטים חזותיים וכו'.
  4. שמירת מצב המשחקתומך בשמירה וחידוש המשחק

דרישות איכות קוד

  1. הערות מפורטותלכל פונקציה ולכל מקטע קוד חשוב חייב להיות תיאור
  2. טיפול בשגיאותמנגנון מקיף ללכידת וטיפול בחריגים
  3. קוד אלגנטי: פעל לפי שיטות עבודה מומלצות, קל להבנה ולתחזוקה
  4. פְּרִישׁוּתקל להוסיף תכונות חדשות בעתיד

אנא ספקו קבצי HTML מלאים המכילים את כל קוד ה-CSS וה-JavaScript כדי להבטיח שניתן יהיה להריץ אותם ישירות בדפדפן. הקוד צריך להדגים כישורי תכנות מקצועיים והבנה מעמיקה של פיתוח משחקים.

במיני-משחק, קלוד חווה אירוע רציני. גם אופוס וגם סונט יצרו את בלוקי הטטריס המתאימים כנדרש, במיוחד את הלוגיקה עבור בלוקים מיוחדים. דיפסיק טיפל בנושא שקלוד פספס, אך החמיץ את הבלוקים המיוחדים, וכתוצאה מכך ג'מיני 2.5 פרו יצר בלוקים שלא ניתנים למשחק.

דיפסיק-R1-0528: המשימה בוצעה בצורה טובה מאוד ובהתאם למפרט, אך עיצוב הבלוקים המיוחד הושמט ולא יושם כלל. ייתכן שהדבר נובע מבעיות במעקב אחר מילות ההנחיה. דף האינטרנט כולו דומה לממשק משחק, כאשר כל הכפתורים נראים כמו רכיבים סטנדרטיים.

קלוד אופוס 4: השלמתי את הלוגיקה עבור בלוקים מיוחדים ולוגיקה אחרת ללא בעיות, אך התעלם מההנחיה להחלפת ערכות נושא, אותה הוא לא יישם. בהשוואה לבעיות של DeepSeek, זוהי בעיה קטנה יותר, אך הממשק מקודד קשיח ללא לוגיקה רספונסיבית, כך שהפרופורציות מעט לא נכונות, מה שהופך חלק מהכפתורים לבלתי ניתנים ללחיצה.

קלוד סונטה 4: דומה ל-Opus, אבל אני חושב ש-Sonnet 4 עדיף על Opus. גם התאמת העמוד טובה. זה מרגיש כאילו Sonnet ניצחה, שכן היא השלימה את כל הפונקציות הנדרשות.

ג'מיני 2.5 פרו: ג'מיני מתקשה באופן עקבי עם לוגיקה מורכבת. הפעם, היא הייתה בלתי שמישית לחלוטין מכיוון שבמיקום הלבנים היה באג, מה שהפך את זה לבלתי אפשרי לחזות היכן הם ינחתו. זה הכי גרוע.

עד עכשיו, אני חושב שאתם נדהמים בדיוק כמוני מהביצועים של ה-DeepSeek-R1.

קשה להאמין שזה רק שדרוג קטן של הדגם. בואו נשווה את המחירים של הדגמים האלה עם ה-DeepSeek R1 0528.

Opus 4 יקר פי 30, וזה לפי התמחור של Openrouter - המחיר הרשמי יהיה אפילו יותר מדהים.

דֶגֶםאורך ההקשרמחיר קלט (אסימוני $/M)מחיר פלט (אסימוני $/M)מחיר תמונה ($/K טוקנים)
DeepSeek R1 0528160 אלף0.502.18
תצוגה מקדימה של ג'מיני 2.5 פרו1000 אלף1.25105.16
קלוד סונטה 4200 אלף3.00154.80
קלוד אופוס 4200 אלף15.007524.00

כמי שעוסק מדי יום בחדשות בינה מלאכותית, הייתי עד לאינספור "פריצות דרך" שבסופו של דבר התבררו כ"מאכזבות". אבל הפעם זה שונה. DeepSeek-R1 נתן לי תקווה אמיתית.

הפרש מחיר פי 30 אך ביצועים כמעט שווים.

אנחנו כבר לא צריכים לשלם מחירים מופרזים כדי להשתמש במודלים הטובים ביותר של תכנות בינה מלאכותית, וגם לא צריכים לעשות פשרות כואבות בין עלות לאיכות. מה שמעורר השראה עוד יותר הוא שזה המודל שלנו.

המשפט הזה נכתב על ידי בינה מלאכותית, ואני חושב שהוא נהדר: המהפכה האמיתית מתחילה לעתים קרובות כאשר אנשים רגילים יכולים להושיט יד אל הכוכבים.

פוסטים דומים

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *