zddeepseeker - Deepseek R1 - Página 2 de 3

Sem categoria

Tecnologia DeepSeek-R1 revelada: os princípios básicos do artigo são detalhados e a chave para o desempenho inovador do modelo é revelada

Porzddeepseeker 9 de fevereiro de 20259 de fevereiro de 2025

Hoje compartilharemos DeepSeek R1, Título: DeepSeek-R1: Incentivando a capacidade de raciocínio em LLMs via Aprendizado por Reforço: Incentivando a capacidade de raciocínio de LLM via aprendizado por reforço. Este artigo apresenta a primeira geração de modelos de raciocínio do DeepSeek, DeepSeek-R1-Zero e DeepSeek-R1. O modelo DeepSeek-R1-Zero foi treinado por meio de aprendizado por reforço (RL) em larga escala sem ajuste fino supervisionado (SFT) como uma etapa inicial,…

Sem categoria

Interpretação do artigo DeepSeek R1 e principais pontos técnicos

Porzddeepseeker 9 de fevereiro de 20259 de fevereiro de 2025

1 Contexto Durante o Festival da Primavera, o DeepSeek R1 atraiu novamente grande atenção, e até mesmo o artigo de interpretação do DeepSeek V3 que escrevemos anteriormente também foi retransmitido e muito discutido. Embora tenha havido muitas análises e reproduções do DeepSeek R1, aqui decidimos compilar algumas notas de leitura correspondentes. Usaremos três…

O modelo de baixo custo do Google, a série Gemini 2.0, está atacando: a batalha pela relação custo-benefício em grandes modelos está se intensificando

Sem categoria

O modelo de baixo custo do Google, a série Gemini 2.0, está atacando: a batalha pela relação custo-benefício em grandes modelos está se intensificando

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

O alto custo de usar grandes modelos de IA é uma das principais razões pelas quais muitas aplicações de IA ainda não foram implementadas e promovidas. Escolher desempenho extremo significa enormes custos de poder de computação, o que leva a altos custos de uso que usuários comuns não podem aceitar. A competição por grandes modelos de IA é como uma guerra sem fumaça. Depois…

O Gemini 2.0 domina as paradas, enquanto o DeepSeek V3 grita em seu preço, e um novo campeão em custo-benefício nasce!

Sem categoria

O Gemini 2.0 domina as paradas, enquanto o DeepSeek V3 grita em seu preço, e um novo campeão em custo-benefício nasce!

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

A família Google Gemini 2.0 está finalmente completa! Ela domina as paradas assim que é lançada. Em meio à perseguição e bloqueios de Deepseek, Qwen e o3, o Google lançou três modelos de uma só vez esta manhã: Gemini 2.0 Pro, Gemini 2.0 Flash e Gemini 2.0 Flash-Lite. No ranking de modelos grandes da LMSYS, Gemini…

a16z diálogo com CEO de 27 anos: AI Agent tem um enorme efeito de alavancagem e os preços de longo prazo estarão vinculados aos custos de mão de obra

Sem categoria

a16z diálogo com CEO de 27 anos: AI Agent tem um enorme efeito de alavancagem e os preços de longo prazo estarão vinculados aos custos de mão de obra

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

Destaques O AI Agent remodela a experiência do cliente Jesse Zhang: Como um Agent é realmente construído? Nossa visão é que, com o tempo, ele se tornará cada vez mais como um Agent baseado em linguagem natural, porque é assim que os modelos de linguagem grande (LLMs) são treinados. A longo prazo, se você tiver um agente superinteligente que…

Sem categoria

Cathie Wood: DeepSeek está apenas acelerando o processo de redução de custos; a estrutura de mercado extremamente concentrada comparável à Grande Depressão mudará

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

Destaques A competição com DeepSeek é boa para os EUA Cathie Wood: Acho que isso mostra que o custo da inovação está caindo drasticamente, e que essa tendência já começou. Por exemplo, antes do DeepSeek, o custo do treinamento de inteligência artificial caiu em 75% por ano, e o custo da inferência caiu até 85% para…

Sem categoria

O Google lançou três novos modelos de uma vez: o Gemini-2.0-Pro é gratuito, tem uma pontuação excelente e está em primeiro lugar, além de ser adequado para codificação e processamento de prompts complexos!

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

A história do Gemini 2.0 está acelerando. A versão Flash Thinking Experimental em dezembro trouxe aos desenvolvedores um modelo funcional com baixa latência e alto desempenho. No início deste ano, o 2.0 Flash Thinking Experimental foi atualizado no Google AI Studio para melhorar ainda mais o desempenho ao combinar a velocidade do Flash com recursos de inferência aprimorados. Na semana passada,…

Sem categoria

Ali Qwen2.5-Max ultrapassa DeepSeek-V3! Netizen: A IA da China está rapidamente diminuindo a diferença

Porzddeepseeker 5 de fevereiro de 20255 de fevereiro de 2025

Agora mesmo, outro modelo doméstico foi adicionado à lista da Big Model Arena da Ali, Qwen2.5-Max, que superou DeepSeek-V3 e ficou em sétimo lugar no ranking geral com uma pontuação total de 1332. Ele também superou modelos como Claude 3.5 Sonnet e Llama 3.1 405B de uma só vez. Em particular, ele se destaca na programação…

Últimas notícias! Pesquisador DeepSeek revela online: o treinamento R1 levou apenas duas a três semanas, e uma evolução poderosa do R1 zero foi observada durante o feriado do Ano Novo Chinês

Sem categoria

Últimas notícias! Pesquisador DeepSeek revela online: o treinamento R1 levou apenas duas a três semanas, e uma evolução poderosa do R1 zero foi observada durante o feriado do Ano Novo Chinês

Porzddeepseeker 4 de fevereiro de 20254 de fevereiro de 2025

Últimas notícias! Pesquisador do DeepSeek revela online: o treinamento do R1 levou apenas duas a três semanas, e uma evolução poderosa do R1 zero foi observada durante o feriado do Ano Novo Chinês Agora mesmo, notamos que o pesquisador do DeepSeek Daya Guo respondeu às perguntas dos internautas sobre o DeepSeek R1 e os planos da empresa para o futuro. Só podemos dizer...

O DeepSeek R1 ficou em primeiro lugar no teste de redação criativa, e o o3 mini foi ainda pior do que o o1 mini!

Sem categoria

O DeepSeek R1 ficou em primeiro lugar no teste de redação criativa, e o o3 mini foi ainda pior do que o o1 mini!

Porzddeepseeker fevereiro 3, 2025fevereiro 3, 2025

O DeepSeek R1 ganhou o campeonato no teste de benchmark de escrita de contos criativos, superando com sucesso o jogador dominante anterior, o Claude 3.5 Sonnet! Teste de benchmark O teste de benchmark criado pelo pesquisador Lech Mazur não é uma competição de redação comum. Cada modelo de IA teve que completar 500 contos, e cada conto teve que incorporar de forma inteligente...