zddeepseeker - Deepseek R1 - עמוד 2 מתוך 3

לא מסווג

טכנולוגיית DeepSeek-R1 נחשפה: עקרונות הליבה של הנייר מפורקים והמפתח לביצועי מודל פורצי דרך נחשף

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

היום נשתף את DeepSeek R1, כותרת: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: תמריץ את יכולת החשיבה של LLM באמצעות למידת חיזוק. מאמר זה מציג את הדור הראשון של דגמי החשיבה של DeepSeek, DeepSeek-R1-Zero ו-DeepSeek-R1. מודל DeepSeek-R1-Zero הוכשר באמצעות למידת חיזוק בקנה מידה גדול (RL) ללא כוונון עדין מפוקח (SFT) כצעד ראשוני,...

לא מסווג

פרשנות נייר DeepSeek R1 ונקודות טכניות מרכזיות

עַל יְדֵיzddeepseeker 9 בפברואר 20259 בפברואר 2025

1 רקע במהלך פסטיבל האביב, DeepSeek R1 שוב משך תשומת לב רחבה, ואפילו מאמר הפרשנות של DeepSeek V3 שכתבנו בעבר הועבר גם הוא מחדש ונדון רבות. למרות שהיו הרבה ניתוחים ושחזורים של DeepSeek R1, כאן החלטנו לאסוף כמה הערות קריאה מתאימות. נשתמש בשלושה…

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

לא מסווג

הדגם הזול של גוגל, סדרת Gemini 2.0, תוקף: הקרב על עלות-תועלת בדגמים גדולים הולך ומתעצם

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

העלות הגבוהה של שימוש במודלים גדולים של בינה מלאכותית היא סיבה מרכזית לכך שהרבה יישומי בינה מלאכותית עדיין לא יושמו וקדמו. בחירה בביצועים קיצוניים פירושה עלויות עצומות של כוח מחשוב, מה שמוביל לעלויות שימוש גבוהות שמשתמשים רגילים לא יכולים לקבל. התחרות על דגמי AI גדולים היא כמו מלחמה ללא עשן. לְאַחַר…

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

לא מסווג

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

משפחת Google Gemini 2.0 הושלמה סוף סוף! הוא שולט במצעדים ברגע שהוא שוחרר. בתוך המרדף והחסימות של Deepseek, Qwen ו-o3, גוגל פרסמה שלושה דגמים במכה אחת מוקדם הבוקר: Gemini 2.0 Pro, Gemini 2.0 Flash ו-Gemini 2.0 Flash-Lite. בדירוג הדגמים הגדולים של LMSYS, Gemini…

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

לא מסווג

דיאלוג a16z עם מנכ"ל בן 27: לסוכן AI יש אפקט מינוף עצום, והתמחור לטווח ארוך יהיה צמוד לעלויות העבודה

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

דגשים סוכן בינה מלאכותית מעצב מחדש את חווית הלקוח ג'סי ג'אנג: איך בעצם בנוי סוכן? ההשקפה שלנו היא שעם הזמן, זה יהפוך יותר ויותר כמו סוכן מבוסס שפה טבעית, כי כך מתאמנים מודלים של שפה גדולה (LLMs). בטווח הארוך, אם יש לך סוכן סופר אינטליגנטי ש...

לא מסווג

Cathie Wood: DeepSeek רק מאיץ את תהליך הפחתת העלויות; מבנה השוק המרוכז הקיצוני המשתווה לשפל הגדול ישתנה

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

דגשים התחרות עם DeepSeek טובה עבור Cathie Wood בארה"ב: אני חושב שזה מראה שעלות החדשנות יורדת באופן דרמטי, ושהמגמה הזו כבר החלה. לדוגמה, לפני DeepSeek, עלות אימון הבינה המלאכותית ירדה ב-75% לשנה, ועלות ההסקה אפילו ירדה ב-85% ל...

לא מסווג

גוגל הוציאה שלושה דגמים חדשים בבת אחת: Gemini-2.0-Pro הוא חינמי, בעל ציון יוצא מן הכלל ומדורג במקום הראשון, ומתאים לקידוד ועיבוד הנחיות מורכבות!

עַל יְדֵיzddeepseeker 8 בפברואר 20258 בפברואר 2025

הסיפור של Gemini 2.0 מואץ. גרסת Flash Thinking Experimental בדצמבר הביאה למפתחים מודל עבודה עם חביון נמוך וביצועים גבוהים. מוקדם יותר השנה, 2.0 Flash Thinking Experimental עודכן ב-Google AI Studio כדי לשפר עוד יותר את הביצועים על ידי שילוב מהירות הפלאש עם יכולות הסקה משופרות. בשבוע שעבר,…

לא מסווג

Ali Qwen2.5-Max עוקף את DeepSeek-V3! Netizen: ה-AI של סין מצמצם את הפער במהירות

עַל יְדֵיzddeepseeker 5 בפברואר 20255 בפברואר 2025

זה עתה התווסף דגם מקומי נוסף לרשימת Big Model Arena מאת עלי, Qwen2.5-Max, שעבר את ה-DeepSeek-V3 ודורג במקום השביעי בדירוג הכללי עם ציון כולל של 1332. הוא גם עלה על דגמים כמו קלוד 3.5 Sonnet ו-Llama 3.1 405B בנפילה אחת. במיוחד, הוא מצטיין בתכנות...

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני

לא מסווג

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני

עַל יְדֵיzddeepseeker 4 בפברואר 20254 בפברואר 2025

חדשות מרעננות! חוקר DeepSeek חושף באינטרנט: אימון R1 ארך רק שבועיים עד שלושה, והתפתחות עוצמתית של R1 אפס נצפתה במהלך חופשת ראש השנה הסיני רק עכשיו, שמנו לב שחוקר DeepSeek Daya Guo הגיב לשאלות של גולשים ברשת לגבי DeepSeek R1 ותוכניות החברה קדימה. אנחנו יכולים רק לומר…

DeepSeek R1 הגיע למקום הראשון במבחן הכתיבה היצירתית, ו-o3 mini היה אפילו יותר גרוע מ-o1 mini!

לא מסווג

DeepSeek R1 הגיע למקום הראשון במבחן הכתיבה היצירתית, ו-o3 mini היה אפילו יותר גרוע מ-o1 mini!

עַל יְדֵיzddeepseeker 3 בפברואר 20253 בפברואר 2025

DeepSeek R1 זכה באליפות במבחן הבנצ'מרק כתיבת סיפורים קצרים יצירתיים, ועבר בהצלחה את השחקן הדומיננטי הקודם קלוד 3.5 סונט! מבחן הבנצ'מרק מבחן הבנצ'מרק שעוצב על ידי החוקר לך מזור אינו תחרות הכתיבה הממוצעת שלך. כל דגם בינה מלאכותית נדרש להשלים 500 סיפורים קצרים, וכל סיפור היה צריך לשלב בחוכמה...