Sem categoria - Deepseek R1

O segredo por trás do DeepSeek 1 | DeepSeekMath e detalhes do GRPO

Sem categoria

O segredo por trás do DeepSeek 1 | DeepSeekMath e detalhes do GRPO

Porzddeepseeker 9 de fevereiro de 20259 de fevereiro de 2025

Hoje eu gostaria de compartilhar um artigo do DeepSeek, intitulado DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Este artigo apresenta o DeepSeekMath 7B, que é pré-treinado no DeepSeek-Coder-Base-v1.5 7B com base em uma coleção de 120B tokens relacionados à matemática, linguagem natural e dados de código. O modelo alcançou uma pontuação surpreendente de 51,7% em nível competitivo…

Sem categoria

Tecnologia DeepSeek-R1 revelada: os princípios básicos do artigo são detalhados e a chave para o desempenho inovador do modelo é revelada

Porzddeepseeker 9 de fevereiro de 20259 de fevereiro de 2025

Hoje compartilharemos DeepSeek R1, Título: DeepSeek-R1: Incentivando a capacidade de raciocínio em LLMs via Aprendizado por Reforço: Incentivando a capacidade de raciocínio de LLM via aprendizado por reforço. Este artigo apresenta a primeira geração de modelos de raciocínio do DeepSeek, DeepSeek-R1-Zero e DeepSeek-R1. O modelo DeepSeek-R1-Zero foi treinado por meio de aprendizado por reforço (RL) em larga escala sem ajuste fino supervisionado (SFT) como uma etapa inicial,…

Sem categoria

Interpretação do artigo DeepSeek R1 e principais pontos técnicos

Porzddeepseeker 9 de fevereiro de 20259 de fevereiro de 2025

1 Contexto Durante o Festival da Primavera, o DeepSeek R1 atraiu novamente grande atenção, e até mesmo o artigo de interpretação do DeepSeek V3 que escrevemos anteriormente também foi retransmitido e muito discutido. Embora tenha havido muitas análises e reproduções do DeepSeek R1, aqui decidimos compilar algumas notas de leitura correspondentes. Usaremos três…

O modelo de baixo custo do Google, a série Gemini 2.0, está atacando: a batalha pela relação custo-benefício em grandes modelos está se intensificando

Sem categoria

O modelo de baixo custo do Google, a série Gemini 2.0, está atacando: a batalha pela relação custo-benefício em grandes modelos está se intensificando

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

O alto custo de usar grandes modelos de IA é uma das principais razões pelas quais muitas aplicações de IA ainda não foram implementadas e promovidas. Escolher desempenho extremo significa enormes custos de poder de computação, o que leva a altos custos de uso que usuários comuns não podem aceitar. A competição por grandes modelos de IA é como uma guerra sem fumaça. Depois…

O Gemini 2.0 domina as paradas, enquanto o DeepSeek V3 grita em seu preço, e um novo campeão em custo-benefício nasce!

Sem categoria

O Gemini 2.0 domina as paradas, enquanto o DeepSeek V3 grita em seu preço, e um novo campeão em custo-benefício nasce!

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

A família Google Gemini 2.0 está finalmente completa! Ela domina as paradas assim que é lançada. Em meio à perseguição e bloqueios de Deepseek, Qwen e o3, o Google lançou três modelos de uma só vez esta manhã: Gemini 2.0 Pro, Gemini 2.0 Flash e Gemini 2.0 Flash-Lite. No ranking de modelos grandes da LMSYS, Gemini…

a16z diálogo com CEO de 27 anos: AI Agent tem um enorme efeito de alavancagem e os preços de longo prazo estarão vinculados aos custos de mão de obra

Sem categoria

a16z diálogo com CEO de 27 anos: AI Agent tem um enorme efeito de alavancagem e os preços de longo prazo estarão vinculados aos custos de mão de obra

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

Destaques O AI Agent remodela a experiência do cliente Jesse Zhang: Como um Agent é realmente construído? Nossa visão é que, com o tempo, ele se tornará cada vez mais como um Agent baseado em linguagem natural, porque é assim que os modelos de linguagem grande (LLMs) são treinados. A longo prazo, se você tiver um agente superinteligente que…

Sem categoria

Cathie Wood: DeepSeek está apenas acelerando o processo de redução de custos; a estrutura de mercado extremamente concentrada comparável à Grande Depressão mudará

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

Destaques A competição com DeepSeek é boa para os EUA Cathie Wood: Acho que isso mostra que o custo da inovação está caindo drasticamente, e que essa tendência já começou. Por exemplo, antes do DeepSeek, o custo do treinamento de inteligência artificial caiu em 75% por ano, e o custo da inferência caiu até 85% para…

Sem categoria

O Google lançou três novos modelos de uma vez: o Gemini-2.0-Pro é gratuito, tem uma pontuação excelente e está em primeiro lugar, além de ser adequado para codificação e processamento de prompts complexos!

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

A história do Gemini 2.0 está acelerando. A versão Flash Thinking Experimental em dezembro trouxe aos desenvolvedores um modelo funcional com baixa latência e alto desempenho. No início deste ano, o 2.0 Flash Thinking Experimental foi atualizado no Google AI Studio para melhorar ainda mais o desempenho ao combinar a velocidade do Flash com recursos de inferência aprimorados. Na semana passada,…

DeepSeek TOP17 Melhores Alternativas: Análise Abrangente (2025)

Sem categoria

DeepSeek TOP17 Melhores Alternativas: Análise Abrangente (2025)

Pordeepseeker 6 de fevereiro de 20256 de fevereiro de 2025

Introdução No cenário de rápida evolução da inteligência artificial, o DeepSeek surgiu como um poderoso modelo de linguagem. Esta análise abrangente explora as 17 principais alternativas ao DeepSeek, examinando seus recursos, capacidades e casos de uso exclusivos. Nossa pesquisa se concentra em plataformas internacionais e chinesas que oferecem integração ao DeepSeek ou capacidades semelhantes. Análise das principais alternativas 1….

Sem categoria

Ali Qwen2.5-Max ultrapassa DeepSeek-V3! Netizen: A IA da China está rapidamente diminuindo a diferença

Porzddeepseeker 5 de fevereiro de 20255 de fevereiro de 2025

Agora mesmo, outro modelo doméstico foi adicionado à lista da Big Model Arena da Ali, Qwen2.5-Max, que superou DeepSeek-V3 e ficou em sétimo lugar no ranking geral com uma pontuação total de 1332. Ele também superou modelos como Claude 3.5 Sonnet e Llama 3.1 405B de uma só vez. Em particular, ele se destaca na programação…