Büyük AI modellerini kullanmanın yüksek maliyeti, birçok AI uygulamasının henüz uygulanmamış ve tanıtılmamış olmasının başlıca nedenidir. Aşırı performansı seçmek, büyük bilgi işlem gücü maliyetleri anlamına gelir ve bu da sıradan kullanıcıların kabul edemeyeceği yüksek kullanım maliyetlerine yol açar.
Büyük AI modelleri için rekabet dumansız bir savaş gibidir. DeepSeek en son R1 büyük modelini yayınlayıp açık kaynaklı hale getirdikten sonra, OpenAI de baskı altında kendi en son o3 modelini yayınladı. Büyük model oyuncusu Google da düşük maliyetli modeller için kıyasıya rekabete katılmak zorunda kaldı.
Google'ın yeni hamlesi: Gemini serisinin yeni üyeleri tanıtıldı
6 Şubat sabahının erken saatlerinde Google, Gemini modelinin bir dizi yeni versiyonunu piyasaya sürdü. Bunlar arasında, deneysel versiyonu İkizler 2.0 Gemini 2.0 Flash – Lite’ın Pro ve önizleme sürümü büyük ilgi gördü ve Gemini 2.0 Flash’ın son sürümü resmen yayınlandı.
Yeni bir varyant olarak, Google İkizler 2.0 Flash – Lite, milyon token başına yalnızca 0,3 ABD doları gibi oldukça cazip bir fiyata sahip olup, bu da onu Google'ın bugüne kadarki en uygun fiyatlı modeli haline getiriyor.
Gemini 2.0 Pro'nun deneysel sürümü ise metin ile ses ve video arasında dönüşüm yapabilen güçlü yerel çok biçimli yeteneklere sahip.
Gemini 2.0 Flash Thinking'in deneysel versiyonu ücretsiz olarak kullanılabiliyor ve ayrıca YouTube videolarının içeriklerine erişme, bunları çıkarma ve özetleme olanağı da sunuyor.
Google AI Studio ürünleri sorumlusu Logan Kilpatrick, X platformunda yaptığı açıklamada, bu modellerin "Google tarihindeki en güçlü modeller" olduğunu ve tüm geliştiricilerin kullanımına sunulduğunu duyurdu.
Yeni Gemini modellerinin etkileyici performansı ve liderlik tablosundaki sonuçları
Chatbot Arena Large Model Leaderboard'da, Gemini 2.0 Flash Thinking Experimental Edition ve Gemini 2.0 Pro Experimental Edition olağanüstü sonuçlar elde etti. Önceki Google büyük modelleriyle karşılaştırıldığında, Gemini 2.0 büyük ilerleme kaydetti ve şaşırtıcı olmayan bir şekilde, ChatGPT-4o ve DeepSeek-R1'i geride bırakan birleşik bir puanla liderlik tablosunun zirvesine başarıyla ulaştılar. Bu çok büyük bir gelişme.
Bu sonuç, matematik, kodlama ve çok dilli işleme gibi çeşitli alanlardaki büyük modellerin yeteneklerinin kapsamlı bir değerlendirmesine dayanmaktadır.
Fiyat ve performans: Gemini 2.0'ın her çeşidinin kendine özgü avantajları var
Gemini 2.0'ın farklı sürümlerinin fiyat ve performans açısından kendine has özellikleri vardır. Performans ve fiyat arasında bir denge sağlanarak kullanıcılara daha fazla seçenek sunulmuştur. Gemini 2.0'ın farklı sürümlerinin API'leri Google AI Studio ve Vertex AI aracılığıyla çağrılabilir. Geliştiriciler ve kullanıcılar ihtiyaçlarına göre uygun sürümü seçebilirler.
Gemini 2.0, Gemini 1.5'e kıyasla büyük ilerleme ve gelişme kaydetti. Gemini 2.0'ın farklı sürümleri arasında farklılıklar olsa da, hepsi genel olarak iyileştirildi. Özellikle, kullandığınız senaryoyu belirlemeniz gerekir ve ardından size uygun Gemini modelini daha iyi seçebilirsiniz.
Fiyat açısından, Gemini 2.0 Flash ve Gemini 2.0 Flash – Lite hafif dağıtıma odaklanıyor. Bağlam penceresinin uzunluğunda 1 milyona kadar token'ı destekliyorlar ve fiyatlandırma açısından, Gemini 1.5 Flash'ta uzun ve kısa metin işleme arasındaki ayrım kaldırıldı ve fiyat bir birim token fiyatında birleştirildi.
Gemini 2.0 Flash'ın metin çıktısı için milyon token başına maliyeti 0,4 ABD doları olup, bu da uzun metinlerin işlenmesi durumunda Gemini 1.5 Flash'ın fiyatının yarısı kadardır.
Gemini 2.0 Flash – Lite, büyük ölçekli metin çıktı senaryolarında maliyet optimizasyonunda daha da iyidir ve milyon token başına 0,3 USD'lik bir metin çıktı fiyatlandırmasına sahiptir. Google CEO'su Sundar Pichai bile bunu "etkili ve güçlü" olarak övdü.
Performans iyileştirmesi açısından, Gemini 2.0 Flash, Lite sürümünden daha kapsamlı çok modlu etkileşim işlevlerine sahiptir. Görüntü çıktısını ve metin, ses ve video gibi modalitelerin çift yönlü gerçek zamanlı düşük gecikmeli giriş ve çıkışını desteklemesi planlanmaktadır.
Gemini 2.0 Pro'nun deneysel versiyonu kodlama performansı ve karmaşık istemler açısından mükemmeldir. Bağlam penceresi 2 milyon token'a kadar ulaşabilir ve genel yeteneği önceki nesle kıyasla 75.8%'den 79.1%'ye çıkmıştır, bu da Gemini 2.0 Flash ve Gemini 2.0 Flash – Lite ile kodlama ve muhakeme yeteneğinde önemli bir farktır.
Gemini uygulama ekibi, X platformunda Gemini Advanced kullanıcılarının Gemini 2.0 Pro deneysel sürümüne model açılır menüsünden erişebileceğini, Gemini 2.0 Flash Thinking deneysel sürümünün ise Gemini uygulama kullanıcıları için ücretsiz olduğunu ve bu sürümün YouTube, Google arama ve Google Haritalar ile birlikte kullanılabildiğini belirtti.
Rekabete karşı koyma: Google model maliyet etkinliği yarışması
Model geliştirme maliyetinin sektörde sıcak bir konu haline geldiği bir dönemde, açık kaynaklı, düşük maliyetli, yüksek performanslı DeepSeek – R1'in piyasaya sürülmesi tüm sektörü etkiledi.
Google'ın 2024 dördüncü çeyrek mali raporunun yayınlanmasının ardından gerçekleştirilen konferans görüşmesinde Pichai, DeepSeek'nin başarılarını takdir ederken, Gemini serisi modellerinin maliyet, performans ve gecikme arasındaki dengede lider olduğunu ve genel performansının DeepSeek'nin V3 ve R1 modellerinden daha iyi olduğunu vurguladı.
Yang Likun ve ekibi tarafından oluşturulan LiveBench büyük model performans kıyaslama testinin sıralaması açısından, Gemini 2.0 Flash'ın genel sıralaması DeepSeek V3 ve OpenAI'nin o1 - mini'sinden daha yüksek, ancak DeepSeek - R1 ve OpenAI'nin o1'inin gerisinde. Ancak, Google'ın Gemini 2.0 Flash - Lite'ı piyasaya sürmesi bir koz gibi. Google, en son büyük modelleri daha fazla kişi için uygun fiyatlı hale getirmeyi, kullanıcıların kullanım maliyetlerini düşürmeyi ve şirketler arasındaki fiyat/performans rekabetinde bir yer edinmeyi umuyor.
Google'ın piyasaya sürülmesinden sonra son Gemini 2.0, bir internet kullanıcısı Gemini 2.0 Flash ve diğer popüler deepseek ve openai GPT-4o modellerini kendi başına analiz etmeye başladı. Gemini 2.0 Flash'ın yeni sürümünün hem performans hem de maliyet açısından diğer iki modelden daha iyi performans gösterdiğini buldu. Bu ayrıca bize Google'ın gelişimi ve evrimi hakkında bir fikir veriyor ve iyi bir başlangıç.
Özellikle, Gemini 2.0 Flash'ın girdi için milyon token başına 0,1 ABD doları ve çıktı için 0,4 ABD doları maliyeti var ve her ikisi de DeepSeek V3'ten çok daha düşük. Bu büyük bir iyileştirme ve gelişme. İnternet kullanıcısı ayrıca X platformunda şunları belirtti: "Gemini 2.0 Flash'ın resmi sürümü GPT-4o-mini'nin üçte birine mal olurken, üç kat daha hızlı."
Büyük model pazarında yeni bir trend: Paranın karşılığı kraldır
Bugün, büyük model alanı yeni bir fiyat savaşına yakalandı. Geçmişte, büyük modellerin kullanımının yüksek maliyeti, bunların kullanımına ve tanıtımına karşı bir miktar direnç yaratmıştı. DeepSeek tarafından tetiklenen büyük modeller için fiyat savaşının denizaşırı büyük model pazarındaki etkisi hala devam ediyor. Aynı zamanda, açık kaynak seçeneği daha fazla kullanıcının en son büyük model araştırma sonuçlarını anlamasına ve kullanmasına da olanak sağladı. Açık kaynak + düşük fiyat stratejisi ayrıca birçok Amerikan büyük model şirketine baskı uyguladı.
Google, Gemini 2.0 Flash-Lite'ı piyasaya sürdü ve OpenAI, ChatGPT arama işlevini tüm kullanıcılar için ücretsiz olarak kullanıma sundu, böylece kullanıcılar arama işlevini daha çeşitli görevleri tamamlamak için kullanabilir. Meta'nın dahili ekibi ayrıca, Meta'nın açık kaynaklı büyük modellerinin daha da geliştirilmesini teşvik ederken büyük model fiyat düşürme stratejileri üzerine araştırmaları da artırıyor.
Bu son derece rekabetçi alanda, hiçbir şirket rahatça bir numaralı noktada oturamaz. Şirketler, maliyet etkinliğini iyileştirerek kullanıcıları çekmeye ve elde tutmaya çalışıyor. Bu trend, büyük modellerin saf teknoloji geliştirmeden daha geniş bir uygulamaya geçmesine yardımcı olacak ve gelecekteki büyük model pazarı, maliyet etkinliği için rekabette gelişmeye ve değişmeye devam edecek.