Nos últimos dias, o Deepseek-R1 0528 foi oficialmente disponibilizado como código aberto. No LiveCodeBench, seu desempenho está quase no mesmo nível do o3 (alto) da OpenAI; no teste de benchmark multilíngue da Aider, ele se compara ao Claude Opus. Quando foi lançado no site oficial, testamos rapidamente seus recursos de front-end e os consideramos excepcionalmente…
O modelo DeepSeek R1 passou por uma pequena atualização de versão, sendo a versão atual DeepSeek-R1-0528. Ao acessar a página ou o aplicativo do DeepSeek, ative o recurso "Pensamento Profundo" na interface de diálogo para experimentar a versão mais recente. Os pesos do modelo DeepSeek-R1-0528 foram enviados para o HuggingFace. Nos últimos quatro meses, o DeepSeek-R1 passou por...
Na semana passada, o DeepSeek anunciou que disponibilizaria cinco projetos de código aberto na próxima semana: Os internautas disseram: "Desta vez, o OpenAI realmente está aqui". Agora mesmo, o primeiro projeto de código aberto chegou, relacionado à aceleração de inferência, FlashMLA: Endereço do projeto de código aberto: DeepSeek FlashMLA Ele está com código aberto há duas horas, e o Github já tem mais de 2,7 mil estrelas: O…
O FlashMLA rapidamente ganhou atenção no mundo da inteligência artificial, particularmente no campo de modelos de linguagem grandes (LLMs). Esta ferramenta inovadora, desenvolvida pela DeepSeek, serve como um kernel de decodificação otimizado projetado para GPUs Hopper — chips de alto desempenho comumente usados em computações de IA. O FlashMLA foca no processamento eficiente de sequências de comprimento variável, tornando-o particularmente adequado…