במהלך הימים האחרונים, Deepseek-R1 0528 הפך רשמית לקוד פתוח. ב-LiveCodeBench, הביצועים שלו כמעט דומים ל-o3 (גבוה) של OpenAI; במבחן הרב-לשוני של Aider, הוא עומד במבחן מול קלוד אופוס. כשהוא הושק באתר הרשמי, בדקנו במהירות את יכולות הקצה הקדמי שלו ומצאנו שהן יוצאות דופן...
דגם ה-DeepSeek R1 עבר שדרוג גרסה קל, כאשר הגרסה הנוכחית היא DeepSeek-R1-0528. כשאתם נכנסים לדף האינטרנט או לאפליקציה של DeepSeek, הפעילו את התכונה "חשיבה עמוקה" בממשק הדיאלוג כדי לחוות את הגרסה העדכנית ביותר. משקלי דגם ה-DeepSeek-R1-0528 הועלו ל-HuggingFace. במהלך ארבעת החודשים האחרונים, DeepSeek-R1 עבר...
בשבוע שעבר, DeepSeek הודיעה כי תפתח חמישה פרויקטים בקוד פתוח בשבוע הבא: גולשים אמרו, "הפעם, OpenAI באמת כאן." זה עתה, הגיע פרויקט הקוד הפתוח הראשון, הקשור להאצת מסקנות, FlashMLA: כתובת פרויקט קוד פתוח: DeepSeek FlashMLA זה היה קוד פתוח כבר שעתיים, ול-Github כבר יש 2.7k+ כוכבים: ה...
FlashMLA זכה במהירות לתשומת לב בעולם הבינה המלאכותית, במיוחד בתחום מודלים של שפה גדולה (LLMs). הכלי החדשני הזה, שפותח על ידי DeepSeek, משמש כגרעין פענוח אופטימלי המיועד ל-Hopper GPUs - שבבים בעלי ביצועים גבוהים הנפוצים בחישובי AI. FlashMLA מתמקדת בעיבוד יעיל של רצפים באורך משתנה, מה שהופך אותו למתאים במיוחד...