Kos yang tinggi untuk menggunakan model AI yang besar adalah sebab utama mengapa banyak aplikasi AI masih belum dilaksanakan dan dipromosikan. Memilih prestasi melampau bermakna kos kuasa pengkomputeran yang besar, yang membawa kepada kos penggunaan yang tinggi yang tidak dapat diterima oleh pengguna biasa.
Persaingan untuk model AI yang besar adalah seperti perang tanpa asap. Selepas DeepSeek mengeluarkan dan membuka sumber model besar R1 terkini, OpenAI juga mengeluarkan model o3 terbaharunya sendiri di bawah tekanan. Pemain model besar Google juga terpaksa menyertai persaingan sengit untuk model kos rendah.
Langkah baharu Google: ahli baharu siri Gemini diumumkan
Pada awal pagi 6 Februari, Google melancarkan satu siri versi baharu model Gemini. Antaranya, versi percubaan Gemini 2.0 Pro dan versi pratonton Gemini 2.0 Flash – Lite menarik banyak perhatian, dan versi terkini Gemini 2.0 Flash telah dikeluarkan secara rasmi.
Sebagai varian baharu, Google Gemini 2.0 Flash – Lite mempunyai harga yang sangat menarik iaitu hanya 0.3 USD bagi setiap juta token, menjadikannya model paling berpatutan Google setakat ini.
Versi eksperimen Gemini 2.0 Pro, sebaliknya, mempunyai keupayaan multimodal asli yang berkuasa yang boleh menukar antara teks dan audio dan video.
Versi eksperimen Gemini 2.0 Flash Thinking adalah percuma untuk digunakan dan juga mempunyai keupayaan untuk mengakses, mengekstrak dan meringkaskan kandungan video YouTube.
Logan Kilpatrick, ketua produk Google AI Studio, mengumumkan pada platform X bahawa model ini adalah "model paling berkuasa dalam sejarah Google" dan tersedia untuk semua pembangun.
Prestasi mengagumkan model Gemini baharu dan keputusan dalam papan pendahulu
Dalam Papan Pendahulu Model Besar Arena Chatbot, Gemini 2.0 Flash Thinking Experimental Edition dan Gemini 2.0 Pro Experimental Edition telah mencapai keputusan yang cemerlang. Berbanding dengan model besar Google sebelumnya, Gemini 2.0 telah mencapai kemajuan yang besar, dan tidak mengejutkan, mereka telah berjaya mencapai puncak papan pendahulu, dengan skor gabungan mengatasi ChatGPT-4o dan DeepSeek-R1. Ini adalah peningkatan yang besar.
Keputusan ini berdasarkan penilaian menyeluruh terhadap keupayaan model besar dalam pelbagai bidang, termasuk matematik, pengekodan dan pemprosesan berbilang bahasa.
Harga dan prestasi: setiap varian Gemini 2.0 mempunyai kelebihan tersendiri
Versi Gemini 2.0 yang berbeza mempunyai ciri tersendiri dari segi harga dan prestasi. Keseimbangan antara prestasi dan harga telah dicapai, memberikan pengguna lebih banyak pilihan. API bagi versi Gemini 2.0 yang berbeza boleh dipanggil melalui Google AI Studio dan Vertex AI. Pembangun dan pengguna boleh memilih versi yang sesuai mengikut keperluan mereka.
Gemini 2.0 telah membuat kemajuan dan pembangunan yang hebat berbanding Gemini 1.5. Walaupun versi Gemini 2.0 yang berbeza mempunyai perbezaan, semuanya telah dipertingkatkan secara keseluruhan. Secara khusus, anda perlu menentukan senario yang anda gunakan, dan kemudian anda boleh memilih model Gemini yang sesuai dengan anda dengan lebih baik.
Dari segi harga, Gemini 2.0 Flash dan Gemini 2.0 Flash – Lite memfokuskan pada penggunaan ringan. Mereka menyokong sehingga 1 juta token dalam panjang tetingkap konteks, dan dari segi harga, perbezaan antara pemprosesan teks panjang dan pendek dalam Gemini 1.5 Flash telah dialih keluar, dan harga disatukan pada harga token unit.
Gemini 2.0 Flash berharga 0.4 USD setiap juta token untuk output teks, iaitu separuh daripada harga Gemini 1.5 Flash apabila memproses teks yang panjang.
Gemini 2.0 Flash – Lite adalah lebih baik pada pengoptimuman kos dalam senario output teks berskala besar, dengan harga output teks sebanyak 0.3 USD setiap juta token. Malah Ketua Pegawai Eksekutif Google Sundar Pichai memujinya sebagai "cekap dan berkuasa".
Dari segi peningkatan prestasi, Gemini 2.0 Flash mempunyai fungsi interaksi multimodal yang lebih komprehensif daripada versi Lite. Ia dijadualkan untuk menyokong output imej, serta input dan output kependaman rendah masa nyata dua arah seperti teks, audio dan video.
Versi eksperimen Gemini 2.0 Pro cemerlang dari segi prestasi pengekodan dan gesaan yang kompleks. Tetingkap konteksnya boleh mencapai sehingga 2 juta token, dan keupayaan amnya telah meningkat daripada 75.8% kepada 79.1% berbanding generasi sebelumnya, yang merupakan perbezaan ketara dalam pengekodan dan keupayaan penaakulan dengan Gemini 2.0 Flash dan Gemini 2.0 Flash – Lite.
Pasukan aplikasi Gemini berkata pada platform X bahawa pengguna Gemini Advanced boleh mengakses versi eksperimen Gemini 2.0 Pro melalui menu lungsur model, dan versi eksperimen Gemini 2.0 Flash Thinking adalah percuma kepada pengguna aplikasi Gemini, dan versi ini boleh digunakan bersama dengan YouTube, carian Google dan Peta Google.
Menentang persaingan: Pertandingan keberkesanan kos model Google
Pada masa apabila kos pembangunan model telah menjadi topik hangat dalam industri, pelancaran sumber terbuka, kos rendah, berprestasi tinggi DeepSeek – R1 telah memberi kesan kepada keseluruhan industri.
Semasa panggilan persidangan selepas keluaran laporan kewangan suku keempat 2024 Google, Pichai, sambil mengiktiraf pencapaian DeepSeek, turut menekankan bahawa siri model Gemini mendahului dalam keseimbangan antara kos, prestasi dan kependaman, dan prestasi keseluruhannya lebih baik daripada model V3 dan R1 DeepSeek.
Dari perspektif penarafan ujian penanda aras prestasi model besar LiveBench yang dibina oleh Yang Likun dan pasukannya, kedudukan keseluruhan Gemini 2.0 Flash adalah lebih tinggi daripada DeepSeek V3 dan o1 OpenAI – mini, tetapi ia berada di belakang DeepSeek – R1 dan o1 OpenAI. Walau bagaimanapun, pelancaran Google Gemini 2.0 Flash – Lite adalah seperti kad truf. Google berharap untuk menjadikan model besar terbaharu mampu milik lebih ramai orang, mengurangkan kos penggunaan pengguna dan berharap dapat menduduki tempat dalam persaingan antara syarikat untuk harga/prestasi.
Selepas Google mengeluarkan Gemini 2.0 terkini, seorang netizen mula mencuba dan menganalisis Gemini 2.0 Flash dan model deepseek dan openai GPT-4o popular yang lain dengan sendiri. Beliau mendapati bahawa versi baharu Gemini 2.0 Flash mengatasi dua model lain dari segi prestasi dan kos. Ini juga memberi kita gambaran tentang perkembangan dan evolusi Google, dan ini merupakan permulaan yang baik.
Khususnya, Gemini 2.0 Flash berharga 0.1 USD setiap juta token untuk input dan 0.4 USD untuk output, kedua-duanya jauh lebih rendah daripada DeepSeek V3. Ini adalah peningkatan dan pembangunan yang besar. Netizen juga menunjukkan pada platform X: "Versi rasmi Gemini 2.0 Flash berharga satu pertiga daripada GPT-4o-mini, manakala ia adalah tiga kali lebih pantas."
Trend baharu dalam pasaran model besar: nilai untuk wang adalah raja
Hari ini, bidang model besar terperangkap dalam perang harga baharu. Pada masa lalu, kos yang tinggi untuk menggunakan model besar telah menimbulkan beberapa rintangan terhadap penggunaan dan promosi mereka. Kesan perang harga untuk model besar yang dicetuskan oleh DeepSeek ke atas pasaran model besar di luar negara masih terus berkembang. Pada masa yang sama, pilihan sumber terbuka juga telah membolehkan lebih ramai pengguna memahami dan menggunakan hasil penyelidikan model besar terkini. Strategi sumber terbuka + harga rendah juga telah memberi tekanan kepada banyak syarikat model besar Amerika.
Google melancarkan Gemini 2.0 Flash-Lite, dan OpenAI menjadikan fungsi carian ChatGPT tersedia secara percuma kepada semua pengguna, supaya pengguna boleh menggunakan fungsi carian untuk menyelesaikan tugas yang lebih pelbagai. Pasukan dalaman Meta juga meningkatkan penyelidikan mengenai strategi pengurangan harga model besar sambil mempromosikan pembangunan selanjutnya model besar sumber terbuka Meta.
Dalam bidang yang sangat kompetitif ini, tiada syarikat boleh duduk dengan selesa di tempat nombor satu. Syarikat cuba menarik dan mengekalkan pengguna dengan meningkatkan keberkesanan kos. Trend ini akan membantu model besar beralih daripada pembangunan teknologi tulen kepada aplikasi yang lebih luas, dan pasaran model besar masa depan akan terus berkembang dan berubah dalam persaingan untuk keberkesanan kos.