Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertempuran untuk efektivitas biaya dalam model besar semakin intensif

Biaya tinggi untuk menggunakan model AI yang besar merupakan alasan utama mengapa banyak aplikasi AI belum diimplementasikan dan dipromosikan. Memilih kinerja ekstrem berarti biaya daya komputasi yang besar, yang berujung pada biaya penggunaan tinggi yang tidak dapat diterima oleh pengguna biasa.

Persaingan untuk model AI besar bagaikan perang tanpa asap. Setelah DeepSeek merilis dan membuka sumber model besar R1 terbaru, OpenAI juga merilis model o3 terbarunya sendiri di bawah tekanan. Pemain model besar Google juga harus bergabung dalam persaingan ketat untuk model berbiaya rendah.

Daftar Isi

Langkah baru Google: anggota baru seri Gemini terungkap

Pada pagi hari tanggal 6 Februari, Google meluncurkan serangkaian versi baru model Gemini. Di antaranya, versi eksperimental Gemini 2.0 Versi Pro dan pratinjau Gemini 2.0 Flash – Lite menarik banyak perhatian, dan versi terbaru Gemini 2.0 Flash resmi dirilis.

Sebagai varian baru, Google Gemini 2.0 Flash – Lite memiliki harga yang sangat menarik, hanya 0,3 USD per juta token, menjadikannya model Google yang paling terjangkau hingga saat ini.

Sebaliknya, versi eksperimental Gemini 2.0 Pro memiliki kemampuan multimoda asli yang kuat yang dapat mengkonversi antara teks dengan audio dan video.

Versi eksperimental Gemini 2.0 Flash Thinking gratis untuk digunakan dan juga memiliki kemampuan untuk mengakses, mengekstrak, dan meringkas konten video YouTube.

Logan Kilpatrick, kepala produk Google AI Studio, mengumumkan pada platform X bahwa model-model ini adalah "model terkuat dalam sejarah Google" dan tersedia untuk semua pengembang.

Performa dan hasil mengesankan dari model Gemini baru di papan peringkat

Dalam Papan Peringkat Model Besar Chatbot Arena, Gemini 2.0 Flash Thinking Experimental Edition dan Gemini 2.0 Pro Experimental Edition telah mencapai hasil yang luar biasa. Dibandingkan dengan model besar Google sebelumnya, Gemini 2.0 telah membuat kemajuan besar, dan tidak mengherankan, mereka telah berhasil mencapai puncak papan peringkat, dengan skor gabungan melampaui ChatGPT-4o dan DeepSeek-R1. Ini adalah peningkatan yang sangat besar.

Hasil ini didasarkan pada evaluasi komprehensif terhadap kemampuan model besar di berbagai bidang, termasuk matematika, pengkodean, dan pemrosesan multibahasa.

Harga dan performa: setiap varian Gemini 2.0 memiliki keunggulannya sendiri

Berbagai versi Gemini 2.0 memiliki karakteristiknya sendiri dalam hal harga dan performa. Keseimbangan antara performa dan harga telah tercapai, sehingga pengguna memiliki lebih banyak pilihan. API dari berbagai versi Gemini 2.0 dapat diakses melalui Google AI Studio dan Vertex AI. Pengembang dan pengguna dapat memilih versi yang sesuai dengan kebutuhan mereka.

Gemini 2.0 telah mengalami kemajuan dan pengembangan yang luar biasa dibandingkan dengan Gemini 1.5. Meskipun ada perbedaan pada setiap versi Gemini 2.0, semuanya telah mengalami peningkatan secara keseluruhan. Secara khusus, Anda perlu menentukan skenario yang Anda gunakan, dan kemudian Anda dapat memilih model Gemini yang sesuai dengan Anda.

Dari segi harga, Gemini 2.0 Flash dan Gemini 2.0 Flash – Lite berfokus pada penerapan yang ringan. Keduanya mendukung hingga 1 juta token dalam panjang jendela konteks, dan dari segi harga, perbedaan antara pemrosesan teks panjang dan pendek di Gemini 1.5 Flash telah dihapus, dan harganya disatukan pada harga token satuan.

Gemini 2.0 Flash berharga 0,4 USD per juta token untuk keluaran teks, yang merupakan setengah harga Gemini 1.5 Flash saat memproses teks panjang.

Gemini 2.0 Flash – Lite bahkan lebih baik dalam hal optimasi biaya dalam skenario keluaran teks skala besar, dengan harga keluaran teks sebesar 0,3 USD per juta token. Bahkan CEO Google Sundar Pichai memujinya sebagai “efisien dan bertenaga”.

Dalam hal peningkatan kinerja, Gemini 2.0 Flash memiliki fungsi interaksi multimoda yang lebih komprehensif daripada versi Lite. Perangkat ini dijadwalkan untuk mendukung keluaran gambar, serta input dan keluaran dua arah secara real-time dengan latensi rendah untuk berbagai modalitas seperti teks, audio, dan video.

Versi eksperimental Gemini 2.0 Pro unggul dalam hal kinerja pengkodean dan perintah kompleks. Jendela konteksnya dapat mencapai hingga 2 juta token, dan kemampuan umumnya telah meningkat dari 75.8% menjadi 79.1% dibandingkan dengan generasi sebelumnya, yang merupakan perbedaan signifikan dalam kemampuan pengkodean dan penalaran dengan Gemini 2.0 Flash dan Gemini 2.0 Flash – Lite.

Tim aplikasi Gemini mengatakan pada platform X bahwa pengguna Gemini Advanced dapat mengakses versi eksperimental Gemini 2.0 Pro melalui menu tarik-turun model, dan versi eksperimental Gemini 2.0 Flash Thinking gratis bagi pengguna aplikasi Gemini, dan versi ini dapat digunakan bersama dengan YouTube, Google Penelusuran, dan Google Maps.

Melawan persaingan: Kontes efektivitas biaya model Google

Pada saat biaya pengembangan model telah menjadi topik hangat dalam industri, peluncuran DeepSeek – R1 yang bersumber terbuka, berbiaya rendah, dan berkinerja tinggi telah berdampak pada seluruh industri.

Selama panggilan konferensi setelah rilis laporan keuangan Google kuartal keempat 2024, Pichai, sambil mengakui pencapaian DeepSeek, juga menekankan bahwa model seri Gemini memimpin dalam keseimbangan antara biaya, kinerja, dan latensi, dan bahwa kinerja keseluruhannya lebih baik daripada model V3 dan R1 DeepSeek.

Dari perspektif pemeringkatan uji tolok ukur kinerja model besar LiveBench yang dibuat oleh Yang Likun dan timnya, peringkat keseluruhan Gemini 2.0 Flash lebih tinggi daripada DeepSeek V3 dan OpenAI o1 – mini, tetapi masih di belakang DeepSeek – R1 dan OpenAI o1. Namun, peluncuran Gemini 2.0 Flash – Lite oleh Google seperti kartu truf. Google berharap dapat membuat model besar terbaru terjangkau bagi lebih banyak orang, mengurangi biaya penggunaan pengguna, dan berharap dapat menempati tempat dalam persaingan antarperusahaan untuk harga/kinerja.

Setelah Google merilis Gemini 2.0 terbaru, seorang netizen mulai mencoba dan menganalisis Gemini 2.0 Flash dan model deepseek dan openai GPT-4o populer lainnya sendiri. Ia menemukan bahwa versi baru Gemini 2.0 Flash mengungguli dua model lainnya dalam hal kinerja dan biaya. Ini juga memberi kita gambaran sekilas tentang perkembangan dan evolusi Google, dan ini merupakan awal yang baik.

Secara khusus, Gemini 2.0 Flash berharga 0,1 USD per juta token untuk input dan 0,4 USD untuk output, keduanya jauh lebih rendah daripada DeepSeek V3. Ini adalah peningkatan dan pengembangan yang sangat besar. Netizen juga mengemukakan pada platform X: “Versi resmi Gemini 2.0 Flash berharga sepertiga dari GPT-4o-mini, sementara itu tiga kali lebih cepat.”

Tren baru di pasar model besar: nilai uang adalah raja

Saat ini, bidang model besar terjebak dalam perang harga baru. Di masa lalu, tingginya biaya penggunaan model besar telah menciptakan sejumlah penolakan terhadap penggunaan dan promosinya. Dampak perang harga untuk model besar yang dipicu oleh DeepSeek pada pasar model besar di luar negeri masih terus berlanjut. Pada saat yang sama, opsi sumber terbuka juga memungkinkan lebih banyak pengguna untuk memahami dan menggunakan hasil penelitian model besar terkini. Strategi sumber terbuka + harga rendah juga telah memberi tekanan pada banyak perusahaan model besar Amerika.

Google meluncurkan Gemini 2.0 Flash-Lite, dan OpenAI menyediakan fungsi pencarian ChatGPT secara gratis bagi semua pengguna, sehingga pengguna dapat menggunakan fungsi pencarian untuk menyelesaikan tugas yang lebih beragam. Tim internal Meta juga meningkatkan penelitian tentang strategi pengurangan harga model besar sambil mempromosikan pengembangan lebih lanjut model besar sumber terbuka Meta.

Dalam bidang yang sangat kompetitif ini, tidak ada perusahaan yang dapat dengan nyaman berada di posisi nomor satu. Perusahaan berusaha menarik dan mempertahankan pengguna dengan meningkatkan efektivitas biaya. Tren ini akan membantu model-model besar beralih dari pengembangan teknologi murni ke aplikasi yang lebih luas, dan pasar model besar di masa mendatang akan terus berkembang dan berubah dalam persaingan untuk mencapai efektivitas biaya.

Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertarungan untuk efektivitas biaya dalam model besar semakin intensif

Langkah baru Google: anggota baru seri Gemini terungkap

Performa dan hasil mengesankan dari model Gemini baru di papan peringkat

Harga dan performa: setiap varian Gemini 2.0 memiliki keunggulannya sendiri

Melawan persaingan: Kontes efektivitas biaya model Google

Tren baru di pasar model besar: nilai uang adalah raja

Apa itu FlashMLA? Panduan Lengkap tentang Dampaknya pada Kernel Decoding AI

Altman: Kami salah tentang AI open source! DeepSeek telah membuat OpenAI menjadi kurang menguntungkan, dan yang berikutnya adalah GPT-5

Peluncuran pertama! SiliconFlow X Huawei Cloud bersama-sama meluncurkan layanan inferensi DeepSeek R1 & V3 berdasarkan Ascend Cloud!

Artefak manajemen Model Bahasa Besar seperti DeepSeek: Cherry Studio, Chatbox, AnythingLLM, siapa akselerator efisiensi Anda?

DeepSeek telah berhasil! OpenAI mengakui kesalahan sumber tertutup, keunggulan terdepan menjadi lebih kecil

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Tinggalkan Balasan Batalkan balasan

Langkah baru Google: anggota baru seri Gemini terungkap

Performa dan hasil mengesankan dari model Gemini baru di papan peringkat

Harga dan performa: setiap varian Gemini 2.0 memiliki keunggulannya sendiri

Melawan persaingan: Kontes efektivitas biaya model Google

Tren baru di pasar model besar: nilai uang adalah raja

Posting serupa

Tinggalkan Balasan Batalkan balasan