Gemini 2.0 mendominasi grafik, sementara DeepSeek V3 meroket harganya, dan juara hemat biaya baru pun lahir!

The Google Gemini 2.0 keluarga akhirnya lengkap! Album ini mendominasi tangga lagu segera setelah dirilis.

Di tengah pengejaran dan blokade Deepseek, Qwen dan o3, Google merilis tiga model sekaligus pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash, dan Gemini 2.0 Flash-Lite.

Pada peringkat model besar LMSYS, Gemini 2.0-Pro telah melesat ke puncak, dan keluarga Gemini-2.0 semuanya telah maju ke 10 besar.

Daftar Isi

Mari kita lihat dulu kinerja modelnya

The Model Gemini 2.0 dirilis kali ini semuanya memiliki keunggulan tersendiri dalam hal performa!

Gemini 2.0 Pro (Eksperimental)

Sebagai model unggulan dari seri Gemini, versi Pro mewakili kemampuan AI Google yang paling canggih, dan unggul dalam pengkodean dan inferensi secara khusus:

Jendela konteks ekstra besar: mendukung pemrosesan konteks hingga 2 juta token
Integrasi alat yang kuat: mengintegrasikan pencarian Google dan eksekusi kode secara mendalam
Tersedianya: sudah tersedia sebagai versi eksperimental di Google AI Studio, Vertex AI dan platform Gemini Advanced

Gemini 2.0 Kilat

diposisikan sebagai “pekerja keras yang sangat efisien”Dirancang dengan fokus pada keseimbangan kecepatan dan kinerja, dan dimaksudkan untuk memberikan dukungan ideal untuk skenario aplikasi yang memerlukan respons latensi rendah:

Jutaan jendela konteks: Mendukung konteks 1M token
Kemampuan inferensi multimodal yang sangat baik: Baik dalam memproses data multimodal, saat ini mendukung input multimodal dan input teks modal tunggal
Perluasan fitur masa mendatang: Fungsi pembuatan gambar dan text-to-speech akan segera tersedia
Tersedianya: Dirilis secara resmi pada platform Vertex AI Studio dan Google AI Studio, dan dapat diakses melalui API Gemini.

Gemini 2.0 Flash-Lite (Pratinjau)

Sebagai model yang “paling hemat biaya”, Flash-Lite menawarkan keseimbangan terbaik antara kecepatan, biaya, dan kinerja.

Keunggulan hemat biaya: Sambil mempertahankan kecepatan dan biaya yang sama seperti Flash 1.5, ia mengungguli Flash 1.5 dalam sebagian besar uji benchmark.
Jendela konteks tingkat jutaan: Juga mendukung 1 juta token daya pemrosesan konteks.

Menurut perbandingan evaluasi kinerja yang dirilis oleh Google, versi Gemini 2.0 Pro Eksperimental mencapai skor tertinggi di hampir semua tes benchmark, dengan kinerja yang sangat baik:

Ia bekerja dengan sangat baik dalam tugas pembuatan kode (seperti LiveCodeBench v5) dan masalah matematika yang rumit (seperti aljabar, geometri, dan kalkulus). Selain itu, ada peningkatan signifikan dalam pengujian pemahaman dokumen panjang yang rumit.

Dan harganya

Google juga merupakan produsen yang cermat dalam hal efektivitas biaya API.

Jutaan token Gemini 2.0 Flash berharga kurang dari satu dolar… Mendukung berbagai mode, pencarian jaringan, dan jendela konteks yang belum pernah ada sebelumnya.

Sebaliknya, Deepseek V3 saat ini berharga satu dolar untuk satu juta token, dan inferensi R1 berharga empat dolar.

PS: Tapi saya tetap ingin berterima kasih kepada DeepSeek karena telah menurunkan harga. Siapa pun yang dapat menurunkan harga adalah keluarga.

Ini benar-benar terlalu murah! Dibandingkan dengan performanya, menurut saya yang diabaikan Gemini adalah harganya!

Kinerja kasus

Karena mengklaim sama bagusnya dengan Deepseek, kita pasti harus melihat bagaimana kinerjanya sebenarnya dalam kasus-kasus dan melihat bagaimana berbagai netizen telah mengujinya

Sebuah permainan pinball berbasis fisika

Mari kita lihat kasus populer ini, yang menggunakan mesin fisika untuk mensimulasikan efek realistis seperti tabrakan, gesekan, dan gravitasi.

Petunjuk: Tulis program Python yang menampilkan bola yang memantul di dalam segi enam yang berputar. Bola tersebut harus dipengaruhi oleh gravitasi dan gesekan, dan harus memantul secara realistis dari dinding yang berputar.

Berikut ini adalah cara kerja Deepseek R1 dan o3-min:

Versi yang dihasilkan oleh Gemini 2.0 Pro Experimental:

Dua model yang tersisa tidak berkinerja baik

Gandakan kesulitannya! Bagi bola menjadi 100 bola!

Petunjuk: Tulis skrip untuk 100 bola kuning terang yang memantul di dalam bola, pastikan untuk menangani deteksi tabrakan dengan benar. Buat bola berputar perlahan. Pastikan bola tetap berada di dalam bola. Terapkan di p5.js

Bagus sekali! Rotasi bola yang lambat sangat halus, dan simulasi hukum fisika sangat bagus. 100 bola juga bertabrakan dengan stabil dan "melakukan tugasnya" ~

Tulis skrip p5.js untuk mensimulasikan 25 partikel yang memantul di ruang hampa di dalam wadah silinder. Gunakan warna yang berbeda untuk setiap bola dan pastikan bola-bola tersebut meninggalkan jejak untuk menunjukkan pergerakannya. Tambahkan rotasi wadah yang lambat untuk mengamati dengan lebih baik apa yang terjadi di tempat kejadian. Pastikan untuk membuat deteksi tabrakan dan aturan fisika yang tepat untuk memastikan partikel-partikel tersebut tetap berada di dalam wadah. Tambahkan wadah bulat eksternal. Tambahkan efek perbesaran dan perkecilan yang lambat ke seluruh tempat kejadian.

Soal ujian stroberi yang tidak bisa dilewati

Dan netizen yang pintar (licik) telah melontarkan tes stroberi klasik lagi:

Berapa jumlah huruf R dalam stroberi?

Dan Gemini 2.0 Flash Thinking Experimental mendapatkan jawaban yang benar:

Bos Google Jeff Dean secara pribadi menguji keterampilan pemrogramannya

Jeff Dean, kepala ilmuwan di Google DeepMind dan Google Research, juga menguji keterampilan pemrograman gelombang Gemini 2.0 Pro:

Dia meminta model tersebut menyelesaikan permainan Boggle klasik, dan kode yang dihasilkan pertama kali berhasil menemukan semua kata yang valid di dalam “kotak surat” permainan:

Lebih jauh, Jeff Dean mengatakan bahwa kode tersebut selesai hanya dalam waktu 18,9 detik, sangat cepat.

CEO Google DeepMind sangat percaya diri dengan pembaruan besar pada model ini, dan mengatakan bahwa rilis ini meletakkan dasar bagi Google untuk mencapai pekerjaan agen cerdas masa depan:

CEO Google Sundar Pichai sebelumnya telah menjelaskan bahwa tahun 2025 akan menjadi periode kritis bagi Google untuk mempercepat pengembangan di bidang AI. Rasanya setelah rilis ini, rute Google lebih jelas!

Dibandingkan dengan rute raksasa lainnya, rute AI Google lebih berfokus pada kepraktisan dan secara langsung menyediakan beberapa pilihan versi, sama seperti kotak peralatan AI, tempat Anda dapat memilih dan memilah sesuai keinginan, sesuai kebutuhan Anda, fleksibel dan nyaman, dan mampu memenuhi semua jenis kebutuhan.

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!