Ces derniers jours, Deepseek-R1 0528 a été officiellement mis en open source. Sur LiveCodeBench, ses performances sont quasiment équivalentes à celles d'OpenAI (o3, niveau élevé) ; dans le test de performance multilingue d'Aider, il tient tête à Claude Opus. Lors de son lancement sur le site officiel, nous avons rapidement testé ses fonctionnalités front-end et les avons trouvées exceptionnellement…
Le modèle DeepSeek R1 a bénéficié d'une mise à jour mineure, la version actuelle étant la DeepSeek-R1-0528. Lorsque vous accédez à la page web ou à l'application DeepSeek, activez la fonction « Réflexion approfondie » dans l'interface de dialogue pour découvrir la dernière version. Les poids du modèle DeepSeek-R1-0528 ont été téléchargés sur HuggingFace. Au cours des quatre derniers mois, le DeepSeek-R1 a bénéficié…
La semaine dernière, DeepSeek a annoncé qu'il ouvrirait la source de cinq projets la semaine prochaine : les internautes ont déclaré : « Cette fois, OpenAI est vraiment là. » Tout à l'heure, le premier projet open source est arrivé, lié à l'accélération de l'inférence, FlashMLA : Adresse du projet open source : DeepSeek FlashMLA Il est open source depuis deux heures, et Github a déjà plus de 2,7 k étoiles : Le…
FlashMLA a rapidement attiré l’attention dans le monde de l’intelligence artificielle, notamment dans le domaine des grands modèles de langage (LLM). Cet outil innovant, développé par DeepSeek, sert de noyau de décodage optimisé conçu pour les GPU Hopper, des puces hautes performances couramment utilisées dans les calculs d’IA. FlashMLA se concentre sur le traitement efficace de séquences de longueur variable, ce qui le rend particulièrement bien adapté…