Como o DeepSeek foi criado? Uma análise do histórico de crescimento do DeepSeek

Como o DeepSeek foi criado? Uma análise do histórico de crescimento do DeepSeek

No futuro, haverá cada vez mais inovações radicais. Pode não ser fácil de entender agora, porque todo o grupo social precisa ser educado por fatos. Quando essa sociedade permitir que as pessoas que inovam de forma radical tenham sucesso, a mentalidade coletiva mudará. Só precisamos de um monte de fatos e um processo....

DeepSeek conseguiu! A OpenAI admite o erro de código fechado, e a vantagem de liderança se torna menor

DeepSeek conseguiu! A OpenAI admite o erro de código fechado, e a vantagem de liderança se torna menor

Depois que a OpenAI lançou o modelo o3-mini, seu CEO Sam Altman, o diretor de pesquisa Mark Chen, o diretor de produtos Kevin Weil, o vice-presidente de engenharia Srinivas Narayanan, a diretora de pesquisa de API Michelle Pokrass e o diretor de pesquisa Hongyu Ren realizaram uma sessão de perguntas e respostas técnicas on-line no reddit, um dos maiores fóruns abrangentes do mundo. Os principais tópicos...

OpenAI o3-mini vs. DeepSeek-R1: quem é o rei da nova geração de modelos de IA?

OpenAI o3-mini vs. DeepSeek-R1: quem é o rei da nova geração de modelos de IA?

O o3-mini está aqui, com o ímpeto de um desafiante Em 31 de janeiro, a OpenAI lançou o novíssimo modelo grande o3-mini e forneceu algumas de suas funções gratuitamente a todos os usuários do ChatGPT. Embora haja um limite no número de consultas, isso permite que os usuários experimentem o mais recente modelo comercial da OpenAI o mais rápido possível....

Primeiro lançamento! SiliconFlow X Huawei Cloud lançam conjuntamente serviços de inferência DeepSeek R1 e V3 baseados na Ascend Cloud!

Primeiro lançamento! SiliconFlow X Huawei Cloud lançam conjuntamente serviços de inferência DeepSeek R1 e V3 baseados na Ascend Cloud!

O DeepSeek-R1 e o DeepSeek-V3 causaram uma sensação global desde seu lançamento de código aberto. Eles são um presente da equipe do DeepSeek para toda a humanidade, e estamos sinceramente felizes por seu sucesso. Após dias de trabalho árduo das equipes da Silicon Mobility e da Huawei Cloud, hoje também estamos oferecendo aos usuários chineses um...

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

A OpenAI lançou seu mais recente modelo de inferência, o o3-mini, que é otimizado para áreas como ciências, matemática e programação, oferecendo resposta mais rápida, maior precisão e menor custo. Em comparação com seu antecessor o1-mini, o o3-mini melhorou significativamente seus recursos de inferência, especialmente na solução de problemas complexos. Os testadores preferem as respostas do o3-mini por 56%, e a taxa de erro foi...

No círculo da IA, o DeepSeek R1 tem superado constantemente o o1 e o Claude em testes físicos, e entramos na era de ouro da RL.

Nenhum de nós esperava que seria assim que 2025 começaria no campo da IA. O DeepSeek R1 é realmente incrível! Recentemente, o "misterioso poder oriental" DeepSeek vem "controlando duramente" o Vale do Silício. Pedi ao R1 que explicasse o teorema de Pitágoras em detalhes. Tudo isso foi feito pela IA em menos de 30 segundos, sem qualquer...

Notícias de última hora! A OpenAI lançou hoje dois novos modelos de inferência: o3-mini e o3-mini-high.

Notícias de última hora! A OpenAI lançou hoje dois novos modelos de inferência: o3-mini e o3-mini-high.

O o3-mini e o o3-mini (high) serão lançados hoje. Os usuários comuns também receberão o o3-mini, e os usuários plus poderão usar o o3-mini (high). O o3-mini (high) é cerca de 200 pontos mais alto que o o1 no Codeforce, mais rápido que o o1 e tem melhor desempenho em codificação e matemática, mas o custo ainda está no nível do o1-mini....

Altman: Estávamos errados sobre a IA de código aberto! O DeepSeek tornou o OpenAI menos vantajoso, e o próximo é o GPT-5

Altman: Estávamos errados sobre a IA de código aberto! O DeepSeek tornou o OpenAI menos vantajoso, e o próximo é o GPT-5

O o3-mini chegou tarde da noite, e a OpenAI finalmente revelou seu mais recente trunfo. Durante uma sessão de perguntas e respostas do Reddit AMA, Altman confessou profundamente que estava do lado errado da IA de código aberto. Ele disse que a estratégia interna de código aberto está sendo considerada, e o modelo continuará a ser desenvolvido, mas...

Paper-DeepSeek-R1: Incentivando a capacidade de raciocínio em LLMs por meio do aprendizado por reforço

Resumo Este documento apresenta os modelos de raciocínio de primeira geração do DeepSeek: DeepSeek-R1-Zero e DeepSeek-R1. O DeepSeek-R1-Zero, treinado por meio de aprendizagem por reforço (RL) em larga escala sem ajuste fino supervisionado (SFT), demonstra recursos de raciocínio notáveis. Por meio da RL, ele desenvolve naturalmente comportamentos de raciocínio poderosos. No entanto, ele enfrenta desafios como baixa legibilidade e mistura de idiomas. Para resolver esses problemas e melhorar o desempenho do raciocínio, foi desenvolvido o DeepSeek-R1,...