雙子座2.0霸榜，DeepSeek V3降價驚艷，新性價比冠軍誕生！ - 深尋 R1

這 Google Gemini 2.0 家庭終於完整了！一推出便霸佔各大排行榜。

在追擊和封鎖中深度探索、Qwen和o3，Google今天凌晨一口氣發布了三款機型：Gemini 2.0 Pro、Gemini 2.0 Flash和Gemini 2.0 Flash-Lite。

在大型型號LMSYS排行榜上，Gemini 2.0-Pro躍居榜首，Gemini-2.0家族全部進入前十名。

目錄

我們先來看看模型表現

這 Gemini 2.0 型號此次發布的產品在性能方面都各有亮點!

Gemini 2.0 Pro（實驗性）

作為 旗艦機型 作為 Gemini 系列的旗艦產品，Pro 版本代表了 Google 最先進的 AI 能力，並且 編碼和推理 尤其：

超大上下文視窗： 支援最多 200 萬個代幣
強大的工具整合： 深度整合谷歌搜尋與程式碼執行
可用性： 已在 Google AI Studio、Vertex AI 和 Gemini Advanced 平台上作為實驗版本提供

雙子座 2.0 閃光

被定位為 “高效率的主力”。它的設計注重平衡速度和性能，旨在為需要低延遲響應的應用場景提供理想的支援：

數百萬個上下文視窗： 支援 1M 令牌上下文
卓越的多模態推理能力： 擅長處理多模態數據，目前支援多模態輸入和單模態文字輸入
未來功能擴充： 圖像生成和文字轉語音功能即將推出
可用性： 在Vertex AI Studio和Google AI Studio平台上正式發布，可透過Gemini API存取。

Gemini 2.0 Flash-Lite（預覽版）

Flash-Lite作為「最具性價比」的模型，在速度、成本和性能之間實現了最佳的平衡。

性價比優勢：在維持與1.5 Flash相同速度與成本的同時，在大多數基準測試中表現均優於1.5 Flash。
百萬級上下文視窗： 也支援 1M 個令牌的上下文處理能力。

根據Google發布的效能評測對比，Gemini 2.0 Pro Experimental 版本在幾乎所有的基準測試中都取得了最高分，表現優異：

它在程式碼生成任務（例如 LiveCodeBench v5）和複雜的數學問題（例如代數、幾何和微積分）中表現特別出色。此外，在理解複雜長篇文件的測試中也有了顯著的提升。

定價

在API性價比方面Google也是一家有良心的廠商。

Gemini 2.0 Flash 的百萬個代幣價格不到一美元…它支援多種模式、網路搜尋和前所未有的上下文視窗。

相比之下，Deepseek V3 目前一百萬個代幣的價格為一美元，R1 推理的價格為四美元。

PS：不過還是要感謝DeepSeek降價了。誰能降價，誰就是家人。

這實在是太便宜了！相較於性能，我覺得Gemini被忽略的就是價格！

案例表現

既然它聲稱與 Deepseek 一樣好，我們當然要看看它在實際情況下的表現如何，看看各位網友是如何測試它的

基於物理的彈珠遊戲

我們先來看這個受歡迎的案例，它使用物理引擎模擬碰撞、摩擦和重力等真實效果。

提示：寫一個 Python 程序，顯示一個球在旋轉的六角形內彈跳。球應該受到重力和摩擦力的影響，並且必須真實地從旋轉的牆壁上彈起。

Deepseek R1 和 o3-min 的表現如下：

Gemini 2.0 Pro Experimental 產生的版本：

其餘兩款車款表現不佳

難度加倍！讓球分裂成100球！

提示：為球體內部 100 個彈跳的亮黃色球編寫一個腳本，確保正確處理碰撞偵測。使球體緩慢旋轉。確保球停留在球體內部。在 p5.js 中實現

做得好！球體的緩慢旋轉非常流暢，對物理定律的模擬非常出色。 100球也在穩定碰撞，「各司其職」~

寫一個 p5.js 腳本來模擬 25 個粒子在圓柱形容器內的真空空間中彈跳。每個球使用不同的顏色，並確保它們留下軌跡來顯示它們的運動。添加容器的緩慢旋轉，以便更好地觀察場景中發生的情況。確保創建適當的碰撞檢測和物理規則，以確保粒子留在容器內。新增外部球形容器。為整個場景添加緩慢放大和縮小的效果。

繞不過去的草莓測試題

聰明的網友們又拋出了經典的草莓測試：

草莓有多少 r

Gemini 2.0 Flash Thinking Experimental 給出了正確答案：

谷歌老闆 Jeff Dean 親自測試了他的程式設計技能

Google DeepMind 和 Google Research 首席科學家 Jeff Dean 也測試了一波 Gemini 2.0 Pro 的程式設計技巧：

他讓模型完成經典的 Boggle 遊戲，並且第一次生成的程式碼就完成了在 “字母方塊” 遊戲：

而且Jeff Dean表示程式碼只花了18.9秒就完成，非常快。

谷歌DeepMind執行長對這次模型的重大更新充滿信心，稱此次發佈為谷歌實現未來未來的智慧代理工作奠定了基礎：

GoogleCEO Sundar Pichai 先前曾明確表示，2025年將是Google在AI領域加速發展的關鍵時期。感覺就像 經過這次發布，Google的路線更加清晰了！

相比其他巨頭的路線，Google的AI路線 更注重實用性，直接提供多種版本選擇就像 一個AI工具箱，可以依照自己的需求隨意選擇，靈活便捷，能夠滿足各類需求。

The Showdown of the Top Four Models! A Review Showcases How Powerful Deepseek R1 Is

未分類

The Showdown of the Top Four Models! A Review Showcases How Powerful Deepseek R1 Is

經過雙ddeepseeker 6 月 1, 20256 月 1, 2025

Over the past few days, Deepseek-R1 0528 has been officially open-sourced. On LiveCodeBench, its performance is nearly on par with OpenAI’s o3 (high); in Aider’s multi-language benchmark test, it holds its own against Claude Opus. When it was launched on the official website, we quickly tested its front-end capabilities and found them to be exceptionally…

未分類

DeepSeek-R1技術揭秘：論文核心原理解析，揭秘模型效能突破關鍵

經過雙ddeepseeker 2025年2月9日2025年2月9日

今天我們來分享DeepSeek R1，標題：DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning：透過強化學習激勵LLM的推理能力。本文介紹了DeepSeek的第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。 DeepSeek-R1-Zero 模型透過大規模強化學習 (RL) 進行訓練，無需監督微調 (SFT) 作為初始步驟，…

突發新聞！ DeepSeek研究人員線上揭露：R1訓練僅需兩至三週，春節期間觀察到R1零度強勢進化

未分類

突發新聞！ DeepSeek研究人員線上揭露：R1訓練僅需兩至三週，春節期間觀察到R1零度強勢進化

經過雙ddeepseeker 2025年2月4日2025年2月4日

突發新聞！ DeepSeek研究員在線透露：R1訓練僅需兩到三週，春節期間觀察到R1 zero的強大進化剛剛，我們注意到DeepSeek研究員Daya Guo回應了網友關於DeepSeek R1以及公司計劃的問題繼續前進。我們只能說…

DeepSeek TOP17 最佳替代方案：綜合分析（2025 年）

未分類

DeepSeek TOP17 最佳替代方案：綜合分析（2025 年）

經過deepseeker 2025年2月6日2025年2月6日

簡介在快速發展的人工智慧領域，DeepSeek 已成為一種強大的語言模型。本綜合分析探討了 DeepSeek 的 17 種替代方案，研究了它們的獨特功能、能力和用例。我們的研究重點是提供 DeepSeek 整合或類似功能的國際和中國平台。最佳替代方案分析 1...

什麼是 FlashMLA？對 AI 解碼內核影響的綜合指南

未分類

什麼是 FlashMLA？對 AI 解碼內核影響的綜合指南

經過deepseeker 2025年2月24日2025年2月24日

FlashMLA 迅速引起了人工智慧領域的關注，特別是在大型語言模型（LLM）領域。這款由 DeepSeek 開發的創新工具是專為 Hopper GPU（常用於 AI 運算的高效能晶片）設計的最佳化解碼核心。 FlashMLA 專注於高效處理可變長度序列，使其特別適合…

a16z對話27歲CEO：AI Agent槓桿效應巨大，長期定價將與人力成本掛鉤

未分類

a16z對話27歲CEO：AI Agent槓桿效應巨大，長期定價將與人力成本掛鉤

經過雙ddeepseeker 2025年2月8日2025年2月8日

亮點 AI Agent 重塑客戶體驗 Jesse Zhang：Agent 究竟是如何建構的？我們認為，隨著時間的推移，它將變得越來越像一個基於自然語言的代理，因為這就是大型語言模型 (LLM) 的訓練方式。從長遠來看，如果你有一個超級智慧代理...

發佈留言取消回覆