טכנולוגיית DeepSeek-R1 נחשפה: עקרונות הליבה של הנייר מפורקים והמפתח לביצועי מודל פורצי דרך נחשף

היום נשתף את DeepSeek R1, כותרת: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: תמריץ את יכולת החשיבה של LLM באמצעות למידת חיזוק. מאמר זה מציג את הדור הראשון של דגמי החשיבה של DeepSeek, DeepSeek-R1-Zero ו-DeepSeek-R1. מודל DeepSeek-R1-Zero הוכשר באמצעות למידת חיזוק בקנה מידה גדול (RL) ללא כוונון עדין מפוקח (SFT) כצעד ראשוני,...

פרשנות נייר DeepSeek R1 ונקודות טכניות מרכזיות

1 רקע במהלך פסטיבל האביב, DeepSeek R1 שוב משך תשומת לב רחבה, ואפילו מאמר הפרשנות של DeepSeek V3 שכתבנו בעבר הועבר גם הוא מחדש ונדון רבות. למרות שהיו הרבה ניתוחים ושחזורים של DeepSeek R1, כאן החלטנו לאסוף כמה הערות קריאה מתאימות. נשתמש בשלושה…

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

העלות הגבוהה של שימוש במודלים גדולים של בינה מלאכותית היא סיבה מרכזית לכך שהרבה יישומי בינה מלאכותית עדיין לא יושמו וקדמו. בחירה בביצועים קיצוניים פירושה עלויות עצומות של כוח מחשוב, מה שמוביל לעלויות שימוש גבוהות שמשתמשים רגילים לא יכולים לקבל. התחרות על דגמי AI גדולים היא כמו מלחמה ללא עשן. לְאַחַר…

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

משפחת Google Gemini 2.0 הושלמה סוף סוף! הוא שולט במצעדים ברגע שהוא שוחרר. בתוך המרדף והחסימות של Deepseek, Qwen ו-o3, גוגל פרסמה שלושה דגמים במכה אחת מוקדם הבוקר: Gemini 2.0 Pro, Gemini 2.0 Flash ו-Gemini 2.0 Flash-Lite. בדירוג הדגמים הגדולים של LMSYS, Gemini…

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

דגשים סוכן בינה מלאכותית מעצב מחדש את חווית הלקוח ג'סי ג'אנג: איך בעצם בנוי סוכן? ההשקפה שלנו היא שעם הזמן, זה יהפוך יותר ויותר כמו סוכן מבוסס שפה טבעית, כי כך מתאמנים מודלים של שפה גדולה (LLMs). בטווח הארוך, אם יש לך סוכן סופר אינטליגנטי ש...

Cathie Wood: DeepSeek רק מאיץ את תהליך הפחתת העלויות; מבנה השוק המרוכז הקיצוני המשתווה לשפל הגדול ישתנה

דגשים התחרות עם DeepSeek טובה עבור Cathie Wood בארה"ב: אני חושב שזה מראה שעלות החדשנות יורדת באופן דרמטי, ושהמגמה הזו כבר החלה. לדוגמה, לפני DeepSeek, עלות אימון הבינה המלאכותית ירדה ב-75% לשנה, ועלות ההסקה אפילו ירדה ב-85% ל...

גוגל הוציאה שלושה דגמים חדשים בבת אחת: Gemini-2.0-Pro הוא חינמי, בעל ציון יוצא מן הכלל ומדורג במקום הראשון, ומתאים לקידוד ועיבוד הנחיות מורכבות!

הסיפור של Gemini 2.0 מואץ. גרסת Flash Thinking Experimental בדצמבר הביאה למפתחים מודל עבודה עם חביון נמוך וביצועים גבוהים. מוקדם יותר השנה, 2.0 Flash Thinking Experimental עודכן ב-Google AI Studio כדי לשפר עוד יותר את הביצועים על ידי שילוב מהירות הפלאש עם יכולות הסקה משופרות. בשבוע שעבר,…

Ali Qwen2.5-Max עוקף את DeepSeek-V3! Netizen: ה-AI של סין מצמצם את הפער במהירות

זה עתה התווסף דגם מקומי נוסף לרשימת Big Model Arena מאת עלי, Qwen2.5-Max, שעבר את ה-DeepSeek-V3 ודורג במקום השביעי בדירוג הכללי עם ציון כולל של 1332. הוא גם עלה על דגמים כמו קלוד 3.5 Sonnet ו-Llama 3.1 405B בנפילה אחת. במיוחד, הוא מצטיין בתכנות...

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני רק עכשיו, שמנו לב שחוקר DeepSeek Daya Guo הגיב לשאלות של גולשים ברשת לגבי DeepSeek R1 ותוכניות החברה קדימה. אנחנו יכולים רק לומר…

DeepSeek R1 הגיע למקום הראשון במבחן הכתיבה היצירתית, ו-o3 mini היה אפילו יותר גרוע מ-o1 mini!

DeepSeek R1 הגיע למקום הראשון במבחן הכתיבה היצירתית, ו-o3 mini היה אפילו יותר גרוע מ-o1 mini!

DeepSeek R1 זכה באליפות במבחן הבנצ'מרק כתיבת סיפורים קצרים יצירתיים, ועבר בהצלחה את השחקן הדומיננטי הקודם קלוד 3.5 סונט! מבחן הבנצ'מרק מבחן הבנצ'מרק שעוצב על ידי החוקר לך מזור אינו תחרות הכתיבה הממוצעת שלך. כל דגם בינה מלאכותית נדרש להשלים 500 סיפורים קצרים, וכל סיפור היה צריך לשלב בחוכמה...