這 Google Gemini 2.0 家庭終於完整了!一推出便霸佔各大排行榜。
在追擊和封鎖中 深度探索、Qwen和o3,Google今天凌晨一口氣發布了三款機型:Gemini 2.0 Pro、Gemini 2.0 Flash和Gemini 2.0 Flash-Lite。

在大型型號LMSYS排行榜上,Gemini 2.0-Pro躍居榜首,Gemini-2.0家族全部進入前十名。

我們先來看看模型表現
這 Gemini 2.0 型號 此次發布的產品在性能方面都各有亮點!

Gemini 2.0 Pro(實驗性)
作為 旗艦機型 作為 Gemini 系列的旗艦產品,Pro 版本代表了 Google 最先進的 AI 能力,並且 編碼和推理 尤其:
- 超大上下文視窗: 支援最多 200 萬個代幣
- 強大的工具整合: 深度整合谷歌搜尋與程式碼執行
- 可用性: 已在 Google AI Studio、Vertex AI 和 Gemini Advanced 平台上作為實驗版本提供

雙子座 2.0 閃光
被定位為 “高效率的主力”。它的設計注重平衡速度和性能,旨在為需要低延遲響應的應用場景提供理想的支援:
- 數百萬個上下文視窗: 支援 1M 令牌上下文
- 卓越的多模態推理能力: 擅長處理多模態數據,目前支援多模態輸入和單模態文字輸入
- 未來功能擴充: 圖像生成和文字轉語音功能即將推出
- 可用性: 在Vertex AI Studio和Google AI Studio平台上正式發布,可透過Gemini API存取。
Gemini 2.0 Flash-Lite(預覽版)
Flash-Lite作為「最具性價比」的模型,在速度、成本和性能之間實現了最佳的平衡。
- 性價比優勢:在維持與1.5 Flash相同速度與成本的同時,在大多數基準測試中表現均優於1.5 Flash。
- 百萬級上下文視窗: 也支援 1M 個令牌的上下文處理能力。
根據Google發布的效能評測對比,Gemini 2.0 Pro Experimental 版本在幾乎所有的基準測試中都取得了最高分,表現優異:

它在程式碼生成任務(例如 LiveCodeBench v5)和複雜的數學問題(例如代數、幾何和微積分)中表現特別出色。此外,在理解複雜長篇文件的測試中也有了顯著的提升。
定價
在API性價比方面Google也是一家有良心的廠商。

Gemini 2.0 Flash 的百萬個代幣價格不到一美元…它支援多種模式、網路搜尋和前所未有的上下文視窗。
相比之下,Deepseek V3 目前一百萬個代幣的價格為一美元,R1 推理的價格為四美元。

PS:不過還是要感謝DeepSeek降價了。誰能降價,誰就是家人。
這實在是太便宜了!相較於性能,我覺得Gemini被忽略的就是價格!
案例表現
既然它聲稱與 Deepseek 一樣好,我們當然要看看它在實際情況下的表現如何,看看各位網友是如何測試它的
基於物理的彈珠遊戲
我們先來看這個受歡迎的案例,它使用物理引擎模擬碰撞、摩擦和重力等真實效果。
提示:寫一個 Python 程序,顯示一個球在旋轉的六角形內彈跳。球應該受到重力和摩擦力的影響,並且必須真實地從旋轉的牆壁上彈起。
Deepseek R1 和 o3-min 的表現如下:

Gemini 2.0 Pro Experimental 產生的版本:

其餘兩款車款表現不佳
難度加倍!讓球分裂成100球!
提示:為球體內部 100 個彈跳的亮黃色球編寫一個腳本,確保正確處理碰撞偵測。使球體緩慢旋轉。確保球停留在球體內部。在 p5.js 中實現

做得好!球體的緩慢旋轉非常流暢,對物理定律的模擬非常出色。 100球也在穩定碰撞,「各司其職」~
寫一個 p5.js 腳本來模擬 25 個粒子在圓柱形容器內的真空空間中彈跳。每個球使用不同的顏色,並確保它們留下軌跡來顯示它們的運動。添加容器的緩慢旋轉,以便更好地觀察場景中發生的情況。確保創建適當的碰撞檢測和物理規則,以確保粒子留在容器內。新增外部球形容器。為整個場景添加緩慢放大和縮小的效果。

繞不過去的草莓測試題
聰明的網友們又拋出了經典的草莓測試:
草莓 有多少 r

Gemini 2.0 Flash Thinking Experimental 給出了正確答案:

谷歌老闆 Jeff Dean 親自測試了他的程式設計技能
Google DeepMind 和 Google Research 首席科學家 Jeff Dean 也測試了一波 Gemini 2.0 Pro 的程式設計技巧:

他讓模型完成經典的 Boggle 遊戲,並且第一次生成的程式碼就完成了在 “字母方塊” 遊戲:

而且Jeff Dean表示程式碼只花了18.9秒就完成,非常快。

谷歌DeepMind執行長對這次模型的重大更新充滿信心,稱此次發佈為谷歌實現未來未來的智慧代理工作奠定了基礎:

GoogleCEO Sundar Pichai 先前曾明確表示,2025年將是Google在AI領域加速發展的關鍵時期。感覺就像 經過這次發布,Google的路線更加清晰了!
相比其他巨頭的路線,Google的AI路線 更注重實用性,直接提供多種版本選擇就像 一個AI工具箱,可以依照自己的需求隨意選擇,靈活便捷,能夠滿足各類需求。