הסוד מאחורי DeepSeek 1 | פרטי DeepSeekMath ו-GRPO

הסוד מאחורי DeepSeek 1 | פרטי DeepSeekMath ו-GRPO

היום אני רוצה לשתף מאמר מ-DeepSeek, שכותרתו DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. מאמר זה מציג את DeepSeekMath 7B, שהוכשר מראש על DeepSeek-Coder-Base-v1.5 7B המבוסס על אוסף של 120B אסימונים הקשורים למתמטיקה, שפה טבעית ונתוני קוד. הדגם השיג ציון מדהים של 51.7% ברמה תחרותית...

טכנולוגיית DeepSeek-R1 נחשפה: עקרונות הליבה של הנייר מפורקים והמפתח לביצועי מודל פורצי דרך נחשף

היום נשתף את DeepSeek R1, כותרת: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: תמריץ את יכולת החשיבה של LLM באמצעות למידת חיזוק. מאמר זה מציג את הדור הראשון של דגמי החשיבה של DeepSeek, DeepSeek-R1-Zero ו-DeepSeek-R1. מודל DeepSeek-R1-Zero הוכשר באמצעות למידת חיזוק בקנה מידה גדול (RL) ללא כוונון עדין מפוקח (SFT) כצעד ראשוני,...

פרשנות נייר DeepSeek R1 ונקודות טכניות מרכזיות

1 רקע במהלך פסטיבל האביב, DeepSeek R1 שוב משך תשומת לב רחבה, ואפילו מאמר הפרשנות של DeepSeek V3 שכתבנו בעבר הועבר גם הוא מחדש ונדון רבות. למרות שהיו הרבה ניתוחים ושחזורים של DeepSeek R1, כאן החלטנו לאסוף כמה הערות קריאה מתאימות. נשתמש בשלושה…

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

העלות הגבוהה של שימוש במודלים גדולים של בינה מלאכותית היא סיבה מרכזית לכך שהרבה יישומי בינה מלאכותית עדיין לא יושמו וקדמו. בחירה בביצועים קיצוניים פירושה עלויות עצומות של כוח מחשוב, מה שמוביל לעלויות שימוש גבוהות שמשתמשים רגילים לא יכולים לקבל. התחרות על דגמי AI גדולים היא כמו מלחמה ללא עשן. לְאַחַר…

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

משפחת Google Gemini 2.0 הושלמה סוף סוף! הוא שולט במצעדים ברגע שהוא שוחרר. בתוך המרדף והחסימות של Deepseek, Qwen ו-o3, גוגל פרסמה שלושה דגמים במכה אחת מוקדם הבוקר: Gemini 2.0 Pro, Gemini 2.0 Flash ו-Gemini 2.0 Flash-Lite. בדירוג הדגמים הגדולים של LMSYS, Gemini…

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

דגשים סוכן בינה מלאכותית מעצב מחדש את חווית הלקוח ג'סי ג'אנג: איך בעצם בנוי סוכן? ההשקפה שלנו היא שעם הזמן, זה יהפוך יותר ויותר כמו סוכן מבוסס שפה טבעית, כי כך מתאמנים מודלים של שפה גדולה (LLMs). בטווח הארוך, אם יש לך סוכן סופר אינטליגנטי ש...

Cathie Wood: DeepSeek רק מאיץ את תהליך הפחתת העלויות; מבנה השוק המרוכז הקיצוני המשתווה לשפל הגדול ישתנה

דגשים התחרות עם DeepSeek טובה עבור Cathie Wood בארה"ב: אני חושב שזה מראה שעלות החדשנות יורדת באופן דרמטי, ושהמגמה הזו כבר החלה. לדוגמה, לפני DeepSeek, עלות אימון הבינה המלאכותית ירדה ב-75% לשנה, ועלות ההסקה אפילו ירדה ב-85% ל...

גוגל הוציאה שלושה דגמים חדשים בבת אחת: Gemini-2.0-Pro הוא חינמי, בעל ציון יוצא מן הכלל ומדורג במקום הראשון, ומתאים לקידוד ועיבוד הנחיות מורכבות!

הסיפור של Gemini 2.0 מואץ. גרסת Flash Thinking Experimental בדצמבר הביאה למפתחים מודל עבודה עם חביון נמוך וביצועים גבוהים. מוקדם יותר השנה, 2.0 Flash Thinking Experimental עודכן ב-Google AI Studio כדי לשפר עוד יותר את הביצועים על ידי שילוב מהירות הפלאש עם יכולות הסקה משופרות. בשבוע שעבר,…

DeepSeek TOP17 האלטרנטיבות הטובות ביותר: ניתוח מקיף (2025)

DeepSeek TOP17 האלטרנטיבות הטובות ביותר: ניתוח מקיף (2025)

הקדמה בנוף המתפתח במהירות של בינה מלאכותית, DeepSeek הופיע כמודל שפה רב עוצמה. ניתוח מקיף זה בוחן את 17 החלופות המובילות ל-DeepSeek, תוך בחינת התכונות הייחודיות שלהן, היכולות ומקרי השימוש שלהן. המחקר שלנו מתמקד הן בפלטפורמות בינלאומיות והן בסיניות המציעות אינטגרציה של DeepSeek או יכולות דומות. ניתוח חלופות מובילות 1….

Ali Qwen2.5-Max עוקף את DeepSeek-V3! Netizen: ה-AI של סין מצמצם את הפער במהירות

זה עתה התווסף דגם מקומי נוסף לרשימת Big Model Arena מאת עלי, Qwen2.5-Max, שעבר את ה-DeepSeek-V3 ודורג במקום השביעי בדירוג הכללי עם ציון כולל של 1332. הוא גם עלה על דגמים כמו קלוד 3.5 Sonnet ו-Llama 3.1 405B בנפילה אחת. במיוחד, הוא מצטיין בתכנות...