Τις τελευταίες ημέρες, το Deepseek-R1 0528 διατίθεται επίσημα ως ανοιχτού κώδικα. Στο LiveCodeBench, η απόδοσή του είναι σχεδόν εφάμιλλη με το o3 (υψηλή) του OpenAI. Στο πολυγλωσσικό benchmark test του Aider, συγκρίνεται με το Claude Opus. Όταν κυκλοφόρησε στον επίσημο ιστότοπο, δοκιμάσαμε γρήγορα τις δυνατότητές του στο front-end και τις διαπιστώσαμε εξαιρετικά...
Το μοντέλο DeepSeek R1 έχει υποβληθεί σε μια μικρή αναβάθμιση έκδοσης, με την τρέχουσα έκδοση να είναι DeepSeek-R1-0528. Όταν εισέρχεστε στην ιστοσελίδα ή την εφαρμογή DeepSeek, ενεργοποιήστε τη λειτουργία "Deep Thinking" στη διεπαφή διαλόγου για να απολαύσετε την πιο πρόσφατη έκδοση. Τα βάρη του μοντέλου DeepSeek-R1-0528 έχουν μεταφορτωθεί στο HuggingFace Τους τελευταίους τέσσερις μήνες, το DeepSeek-R1 έχει υποβληθεί...
Την περασμένη εβδομάδα, το DeepSeek ανακοίνωσε ότι θα επρόκειτο για πέντε έργα ανοιχτού κώδικα την επόμενη εβδομάδα: Οι χρήστες του Διαδικτύου είπαν, «Αυτή τη φορά, το OpenAI είναι πραγματικά εδώ». Μόλις τώρα, ήρθε το πρώτο έργο ανοιχτού κώδικα, που σχετίζεται με την επιτάχυνση συμπερασμάτων, FlashMLA: Διεύθυνση έργου ανοιχτού κώδικα: DeepSeek FlashMLA Είναι ανοιχτού κώδικα για δύο ώρες και το Github έχει ήδη 2,7k+ αστέρια: Το…
Το FlashMLA έχει κερδίσει γρήγορα την προσοχή στον κόσμο της τεχνητής νοημοσύνης, ιδιαίτερα στον τομέα των μεγάλων γλωσσικών μοντέλων (LLMs). Αυτό το καινοτόμο εργαλείο, που αναπτύχθηκε από την DeepSeek, χρησιμεύει ως ένας βελτιστοποιημένος πυρήνας αποκωδικοποίησης που έχει σχεδιαστεί για GPUs Hopper—τσιπ υψηλής απόδοσης που χρησιμοποιούνται συνήθως σε υπολογισμούς τεχνητής νοημοσύνης. Το FlashMLA εστιάζει στην αποτελεσματική επεξεργασία ακολουθιών μεταβλητού μήκους, καθιστώντας το ιδιαίτερα κατάλληλο…