
Hikayesi Geminben 2.0 hızlanıyor.
Aralık ayında yayınlanan Flash Thinking Deneysel versiyonu, geliştiricilere düşük gecikme süresi ve yüksek performans sağlayan çalışan bir model kazandırdı.
Bu yılın başlarında, Google AI Studio'da 2.0 Flash Thinking Experimental güncellendi ve Flash'ın hızıyla gelişmiş çıkarım yeteneklerini birleştirerek performansı daha da iyileştirdi.
Geçtiğimiz hafta güncellenen 2.0 Flash sürümü Gemini masaüstü ve mobil uygulamalarında tam olarak kullanıma sunuldu.
Bugün aynı anda üç yeni üye tanıtıldı: Kodlama ve karmaşık komutlarda şimdiye kadar en iyi performansı gösteren deneysel Gemini 2.0 Pro sürümü, uygun maliyetli 2.0 Flash-Lite sürümü ve düşünme yeteneği geliştirilmiş 2.0 Flash Thinking sürümü.
Gemini 2.0 Pro tüm kategorilerde ilk sırada yer alıyor. Gemini-2.0-Flash kodlama, matematik ve bulmacalarda ilk üçte yer alıyor. Flash-lite tüm kategorilerde ilk onda yer alıyor.


Üç modelin yeteneklerinin karşılaştırmalı tablosu:

Tüm modeller çok modlu giriş ve çıkış metnini destekler.
Daha fazla modal yetenek yolda. Kodlama alanında model gücü çizelgesi

Kazanma oranı ısı haritası

Google, ücretsiz kullanıcılara OpenAI'nin Plus kullanıcılarına davrandığından daha iyi davranıyor. AI Studio'da Gemini 2.0 Pro Experimental'a ücretsiz erişim:

Deepseek servisi her zaman beklerken hata gösteriyor… Hatırlarsanız ilk çıkarımsız model Google AIStudio'da kullanılan 2.0 Flash Thinking'di.

Ayrıca, şu da var: Gemini'nin web versiyonu:
Bir de bağlantılı çıkarım modeli var (o zaman neden ayıralım ki…)

Google, Gemini 2.0 Pro'nun deneysel sürümünü yayınladı ve resmi kıyaslama testlerinde görülen gelişme oldukça dikkat çekici.

En güçlü kodlama yeteneklerine ve karmaşık istemleri işleme yeteneğine sahip olan bu model, Google tarafından bugüne kadar yayınlanan tüm modellerden daha iyi bir şekilde dünya bilgisini anlama ve bu bilgiler hakkında akıl yürütme yeteneğine sahip.
En büyük bağlam penceresine sahip (200k ve uzun bağlamım Gemini modelinin nispeten büyük bir avantajı), bu da büyük miktarda bilgiyi kapsamlı bir şekilde analiz edip anlayabilmesini ve Google arama ve kod yürütme gibi araçları çağırabilmesini sağlıyor.
MATH testinde 1.5 versiyonuna göre yaklaşık yüzde 5'lik bir artışla 91.8% puanına ulaştı. GPQA muhakeme yeteneği 64.7%'ye, SimpleQA dünya bilgisi testi ise 44.3%'ye ulaştı.
En dikkat çekeni programlama yeteneğidir. LiveCodeBench testinde 36.0% elde etti ve Bird-SQL dönüşüm doğruluğu 59.3%'yi aştı. 2 milyon token'lık süper büyük bağlam penceresiyle birleştiğinde, en karmaşık kod analiz görevlerini halletmek için yeterlidir.

İmleçte deneyebilirsiniz.
Çoklu dil anlama yeteneği de etkileyici olup, Global MMLU test puanı 86.5%'dir. Görüntü anlama MMMU'su 72.7%'dir ve video analiz yeteneği 71.9%'dir.
Gemini 2.0 Flash-Lite ilginç bir denge.
1.5 Flash'ın hızını ve maliyetini korur, ancak daha iyi performans getirir. 1 milyon token'lı bağlam penceresi daha fazla bilgiyi işlemesine olanak tanır.
En pratik olanı fiyat/performans oranıdır: 40.000 fotoğraf için altyazı oluşturma $1'den daha ucuza mal olur. Bu, AI'yı daha gerçekçi hale getirir.

Blogger Shrivastava şunları söyledi: Gemini 2.0 Pro kodlaması çılgınca!
İpucu: Güneş sistemi simülasyonu oluşturmak için Three.js kullanın. Bir zaman ölçeği, bir odak açılır menüsü ekleyin, yörüngeleri gösterin ve etiketleri gösterin. Her şeyi tek bir dosyada oluşturun, böylece bunları çevrimiçi bir düzenleyiciye yapıştırabilir ve çıktıyı görüntüleyebilirim.

Ayrıca bazı kullanıcılar Gemini 2.0 Flash'ın kendi paradoks testlerinden birinde daha iyi sonuçlar ürettiğini belirtti:

Son olarak Google, Gemini 2.0'ın yalnızca yamasının değil, güvenliğinin de baştan itibaren tasarımın merkezinde yer aldığını belirtti.
Modelin kendini eleştirmeyi öğrenmesine izin verin. Gemini'nin kendi cevaplarını değerlendirmesine ve daha doğru geri bildirim sağlamasına izin vermek için takviyeli öğrenmeyi kullanın. Bu, hassas konularla uğraşırken onu daha sağlam hale getirir.
Otomatik kırmızı takım testi ilginçtir. Özellikle dolaylı istem sözcüklerinin enjeksiyonunu engellemek için tasarlanmıştır, bu da yapay zekayı verilerde kötü amaçlı komutları gizlemesini önlemek için bir bağışıklık sistemiyle donatmak gibidir.