Bu Google İkizler 2.0 aile nihayet tamamlandı! Yayınlandığı andan itibaren listeleri domine ediyor.

Takip ve ablukalar ortasında DeepseekGoogle, Qwen ve o3 olmak üzere üç modeli bu sabah erken saatlerde tek seferde duyurdu: Gemini 2.0 Pro, Gemini 2.0 Flash ve Gemini 2.0 Flash-Lite.

Büyük model LMSYS sıralamasında Gemini 2.0-Pro zirveye yerleşirken, Gemini-2.0 ailesi ilk 10'a girmeyi başardı.

Önce model performansına bakalım

Bu Gemini 2.0 modelleri bu sefer piyasaya sürülenlerin hepsinin performans açısından kendine özgü öne çıkan özellikleri var!

Gemini 2.0 Pro (Deneysel)

Olarak amiral gemisi modeli Gemini serisinin Pro versiyonu, Google'ın en gelişmiş AI yeteneklerini temsil ediyor ve kodlama ve çıkarım özellikle:

  • Ekstra büyük bağlam penceresi: kadar bağlam işlemeyi destekler 2M token
  • Güçlü araç entegrasyonu: Google arama ve kod yürütmeyi derinlemesine entegre eder
  • Mevcutluk: Google AI Studio, Vertex AI ve Gemini Advanced platformunda deneysel bir sürüm olarak halihazırda mevcuttur

İkizler 2.0 Flaş

bir konumdadır "son derece verimli işgücü"Hız ve performans arasında denge kurmaya odaklanılarak tasarlanmıştır ve düşük gecikmeli yanıtlar gerektiren uygulama senaryoları için ideal destek sağlamak üzere tasarlanmıştır:

  • Milyonlarca bağlam penceresi: 1M token bağlamını destekler
  • Mükemmel çok modlu çıkarım yetenekleri: Çok modlu verileri işlemede iyi, şu anda çok modlu girişi ve tek modlu metin girişini destekliyor
  • Gelecekteki özellik genişlemesi: Görüntü oluşturma ve metinden sese dönüştürme işlevleri yakında kullanıma sunulacak
  • Mevcutluk: Vertex AI Studio ve Google AI Studio platformlarında resmi olarak yayınlanmış olup, Gemini API üzerinden erişim sağlanabilmektedir.

Gemini 2.0 Flash-Lite (Önizleme)

“En uygun maliyetli” model olan Flash-Lite, hız, maliyet ve performans arasında en iyi dengeyi sunuyor.

  • Maliyet avantajı: 1.5 Flash ile aynı hız ve maliyeti korurken, çoğu kıyaslama testinde 1.5 Flash'ı geride bırakıyor.
  • Milyon seviyeli bağlam penceresi: Ayrıca 1M token'lık bağlam işleme gücünü destekler.

Google tarafından yayınlanan performans değerlendirme karşılaştırmasına göre Gemini 2.0 Pro Experimental sürümü, hemen hemen tüm kıyaslama testlerinde en yüksek puanları alarak mükemmel bir performans gösterdi:

Özellikle kod oluşturma görevlerinde (LiveCodeBench v5 gibi) ve karmaşık matematik problemlerinde (cebir, geometri ve kalkülüs gibi) iyi performans gösterdi. Ayrıca, karmaşık uzun belgeleri anlama testinde önemli bir gelişme oldu.

Ve fiyatlandırma

Google aynı zamanda API maliyet etkinliği açısından da bilinçli bir üreticidir.

Gemini 2.0 Flash'ın milyon token'ı bir dolardan daha az maliyetli... Birden fazla modu, ağ aramalarını ve benzersiz bir bağlam penceresini destekliyor.

Buna karşılık, Deepseek V3'ün şu anki maliyeti bir milyon token için bir dolar, R1 çıkarımının maliyeti ise dört dolar.

PS: Ama yine de fiyatı düşürdüğü için DeepSeek'ye teşekkür etmek istiyorum. Fiyatı düşürebilen herkes ailedir.

Bu gerçekten çok ucuz! Performansla karşılaştırıldığında, Gemini'nin gözden kaçırdığı şeyin fiyat olduğunu düşünüyorum!

Dava performansı

Deepseek kadar iyi olduğunu iddia ettiği için, kesinlikle vakalarda nasıl performans gösterdiğini ve çeşitli internet kullanıcılarının bunu nasıl test ettiğini görmeliyiz.

Fizik tabanlı bir pinbol oyunu

Çarpışma, sürtünme, yer çekimi gibi gerçekçi etkileri simüle etmek için fizik motoru kullanan bu popüler vakaya önce bir bakalım.

İpucu: Dönen bir altıgenin içinde zıplayan bir topu gösteren bir Python programı yazın. Top yerçekimi ve sürtünmeden etkilenmeli ve dönen duvarlardan gerçekçi bir şekilde sekmelidir.

Deepseek R1 ve o3-min'in performansı şöyle:

Gemini 2.0 Pro Experimental tarafından oluşturulan sürüm:

Kalan iki model iyi performans göstermiyor

Zorluğu iki katına çıkarın! Topu 100 topa bölün!

İpucu: Çarpışma algılamayı doğru bir şekilde ele aldığınızdan emin olarak, bir kürenin içinde 100 adet zıplayan parlak sarı top için bir betik yazın. Kürenin yavaşça dönmesini sağlayın. Topların kürenin içinde kaldığından emin olun. p5.js'de uygulayın

Aferin! Kürenin yavaş dönüşü çok düzgün ve fizik yasalarının simülasyonu mükemmel. 100 top da istikrarlı bir şekilde çarpışıyor ve "işlerini yapıyor" ~

Silindirik bir kabın içindeki vakumlu alanda zıplayan 25 parçacığı simüle etmek için bir p5.js betiği yazın. Her top için farklı bir renk kullanın ve hareketlerini göstermek için bir iz bıraktıklarından emin olun. Sahnede neler olduğunu daha iyi gözlemlemek için kabın yavaş bir dönüşünü ekleyin. Parçacıkların kabın içinde kalmasını sağlamak için uygun çarpışma algılama ve fizik kurallarını oluşturduğunuzdan emin olun. Harici küresel bir kap ekleyin. Tüm sahneye yavaş bir yakınlaştırma ve uzaklaştırma efekti ekleyin.

Kaçırılmayacak bir çilek test sorusu

Ve kurnaz (sinsi) internet kullanıcıları klasik çilek testini yine ortaya attılar:

Çilek kelimesinde kaç tane r var?

Ve Gemini 2.0 Flash Thinking Experimental doğru cevabı buldu:

Google patronu Jeff Dean, programlama becerilerini bizzat test etti

Google DeepMind ve Google Research'ün baş bilim insanı Jeff Dean de Gemini 2.0 Pro'nun bir dalgasının programlama becerilerini test etti:

Modelin klasik Boggle oyununu tamamlamasını sağladı ve üretilen kod, ilk seferde geçerli tüm kelimeleri bulmayı başardı. "harf karesi" oyun:

Ayrıca Jeff Dean, kodun yalnızca 18.9 saniyede tamamlandığını ve bunun da oldukça hızlı bir süre olduğunu söyledi.

Google DeepMind CEO'su, modele yapılan bu büyük güncellemeye güven duyuyor ve bu sürümün Google'ın gelecekteki akıllı ajan çalışmalarını başarması için temel oluşturduğunu söylüyor:

Google CEO'su Sundar Pichai daha önce 2025'in Google için AI alanında gelişimi hızlandırmak için kritik bir dönem olacağını açıkça belirtmişti. Bu açıklamadan sonra Google'ın rotası daha da netleşti!

Diğer devlerin rotalarıyla karşılaştırıldığında Google'ın AI rotası daha çok pratikliğe odaklanır ve doğrudan birden fazla sürüm seçeneği sunar, tıpkı İhtiyaçlarınıza göre istediğiniz gibi seçip kullanabileceğiniz, esnek ve kullanışlı bir AI araç kutusuve her türlü ihtiyaca cevap verebilecek niteliktedir.

Benzer Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir