Uncategorized - Deepseek R1

הסוד מאחורי DeepSeek 1 | פרטי DeepSeekMath ו-GRPO

לא מסווג

הסוד מאחורי DeepSeek 1 | פרטי DeepSeekMath ו-GRPO

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

היום אני רוצה לשתף מאמר מ-DeepSeek, שכותרתו DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. מאמר זה מציג את DeepSeekMath 7B, שהוכשר מראש על DeepSeek-Coder-Base-v1.5 7B המבוסס על אוסף של 120B אסימונים הקשורים למתמטיקה, שפה טבעית ונתוני קוד. הדגם השיג ציון מדהים של 51.7% ברמה תחרותית...

לא מסווג

טכנולוגיית DeepSeek-R1 נחשפה: עקרונות הליבה של הנייר מפורקים והמפתח לביצועי מודל פורצי דרך נחשף

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

היום נשתף את DeepSeek R1, כותרת: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: תמריץ את יכולת החשיבה של LLM באמצעות למידת חיזוק. מאמר זה מציג את הדור הראשון של דגמי החשיבה של DeepSeek, DeepSeek-R1-Zero ו-DeepSeek-R1. מודל DeepSeek-R1-Zero הוכשר באמצעות למידת חיזוק בקנה מידה גדול (RL) ללא כוונון עדין מפוקח (SFT) כצעד ראשוני,...

לא מסווג

פרשנות נייר DeepSeek R1 ונקודות טכניות מרכזיות

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

1 רקע במהלך פסטיבל האביב, DeepSeek R1 שוב משך תשומת לב רחבה, ואפילו מאמר הפרשנות של DeepSeek V3 שכתבנו בעבר הועבר גם הוא מחדש ונדון רבות. למרות שהיו הרבה ניתוחים ושחזורים של DeepSeek R1, כאן החלטנו לאסוף כמה הערות קריאה מתאימות. נשתמש בשלושה…

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

לא מסווג

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

העלות הגבוהה של שימוש במודלים גדולים של בינה מלאכותית היא סיבה מרכזית לכך שהרבה יישומי בינה מלאכותית עדיין לא יושמו וקדמו. בחירה בביצועים קיצוניים פירושה עלויות עצומות של כוח מחשוב, מה שמוביל לעלויות שימוש גבוהות שמשתמשים רגילים לא יכולים לקבל. התחרות על דגמי AI גדולים היא כמו מלחמה ללא עשן. לְאַחַר…

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

לא מסווג

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

משפחת Google Gemini 2.0 הושלמה סוף סוף! הוא שולט במצעדים ברגע שהוא שוחרר. בתוך המרדף והחסימות של Deepseek, Qwen ו-o3, גוגל פרסמה שלושה דגמים במכה אחת מוקדם הבוקר: Gemini 2.0 Pro, Gemini 2.0 Flash ו-Gemini 2.0 Flash-Lite. בדירוג הדגמים הגדולים של LMSYS, Gemini…

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

לא מסווג

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

דגשים סוכן בינה מלאכותית מעצב מחדש את חווית הלקוח ג'סי ג'אנג: איך בעצם בנוי סוכן? ההשקפה שלנו היא שעם הזמן, זה יהפוך יותר ויותר כמו סוכן מבוסס שפה טבעית, כי כך מתאמנים מודלים של שפה גדולה (LLMs). בטווח הארוך, אם יש לך סוכן סופר אינטליגנטי ש...

לא מסווג

Cathie Wood: DeepSeek רק מאיץ את תהליך הפחתת העלויות; מבנה השוק המרוכז הקיצוני המשתווה לשפל הגדול ישתנה

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

דגשים התחרות עם DeepSeek טובה עבור Cathie Wood בארה"ב: אני חושב שזה מראה שעלות החדשנות יורדת באופן דרמטי, ושהמגמה הזו כבר החלה. לדוגמה, לפני DeepSeek, עלות אימון הבינה המלאכותית ירדה ב-75% לשנה, ועלות ההסקה אפילו ירדה ב-85% ל...

לא מסווג

גוגל הוציאה שלושה דגמים חדשים בבת אחת: Gemini-2.0-Pro הוא חינמי, בעל ציון יוצא מן הכלל ומדורג במקום הראשון, ומתאים לקידוד ועיבוד הנחיות מורכבות!

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

הסיפור של Gemini 2.0 מואץ. גרסת Flash Thinking Experimental בדצמבר הביאה למפתחים מודל עבודה עם חביון נמוך וביצועים גבוהים. מוקדם יותר השנה, 2.0 Flash Thinking Experimental עודכן ב-Google AI Studio כדי לשפר עוד יותר את הביצועים על ידי שילוב מהירות הפלאש עם יכולות הסקה משופרות. בשבוע שעבר,…

DeepSeek TOP17 האלטרנטיבות הטובות ביותר: ניתוח מקיף (2025)

לא מסווג

DeepSeek TOP17 האלטרנטיבות הטובות ביותר: ניתוח מקיף (2025)

עַל יְדֵיdeepseeker 6 בפברואר 20256 בפברואר 2025

הקדמה בנוף המתפתח במהירות של בינה מלאכותית, DeepSeek הופיע כמודל שפה רב עוצמה. ניתוח מקיף זה בוחן את 17 החלופות המובילות ל-DeepSeek, תוך בחינת התכונות הייחודיות שלהן, היכולות ומקרי השימוש שלהן. המחקר שלנו מתמקד הן בפלטפורמות בינלאומיות והן בסיניות המציעות אינטגרציה של DeepSeek או יכולות דומות. ניתוח חלופות מובילות 1….

לא מסווג

Ali Qwen2.5-Max עוקף את DeepSeek-V3! Netizen: ה-AI של סין מצמצם את הפער במהירות

עַל יְדֵיzddeepseeker 5 בפברואר 20255 בפברואר 2025

זה עתה התווסף דגם מקומי נוסף לרשימת Big Model Arena מאת עלי, Qwen2.5-Max, שעבר את ה-DeepSeek-V3 ודורג במקום השביעי בדירוג הכללי עם ציון כולל של 1332. הוא גם עלה על דגמים כמו קלוד 3.5 Sonnet ו-Llama 3.1 405B בנפילה אחת. במיוחד, הוא מצטיין בתכנות...