Високата цена за користење на големи модели со вештачка интелигенција е главна причина зошто многу апликации за вештачка интелигенција сè уште не се имплементирани и промовирани. Изборот на екстремни перформанси значи огромни трошоци за компјутерска моќ, што доведува до високи трошоци за користење што обичните корисници не можат да ги прифатат.
Конкуренцијата за големи модели со вештачка интелигенција е како војна без чад. Откако DeepSeek го објави и го отвори кодот најновиот голем модел R1, OpenAI го објави и својот најнов модел o3 под притисок. На жестоката конкуренција за евтини модели мораше да се приклучи и големиот модел на Google.
Новиот потег на Google: претставени новите членови на серијата Gemini
Во раните утрински часови на 6 февруари, Google лансираше серија нови верзии на моделот Gemini. Меѓу нив, експерименталната верзија на Близнаци 2.0 Про и верзијата за преглед на Gemini 2.0 Flash – Lite привлече големо внимание, а најновата верзија на Gemini 2.0 Flash беше официјално објавена.
Како нова варијанта, Google Gemini 2.0 Flash – Лајт има многу привлечна цена од само 0,3 УСД за милион токени, што го прави најприфатливиот модел на Google досега.
Експерименталната верзија на Gemini 2.0 Pro, од друга страна, има моќни природни мултимодални способности кои можат да конвертираат помеѓу текст и аудио и видео.
Експерименталната верзија на Gemini 2.0 Flash Thinking е бесплатна за користење и исто така има можност за пристап, извлекување и сумирање на содржината на видеата на YouTube.
Логан Килпатрик, шеф на производите на Google AI Studio, објави на платформата X дека овие модели се „најмоќните модели во историјата на Google“ и се достапни за сите програмери.
Импресивните перформанси на новите модели Gemini и резултатите во таблата на водачи
Во таблата со големи модели на Chatbot Arena, Gemini 2.0 Flash Thinking Experimental Edition и Gemini 2.0 Pro Experimental Edition постигнаа извонредни резултати. Во споредба со претходните големи модели на Google, Gemini 2.0 постигна голем напредок и не е изненадувачки, тие успешно го достигнаа врвот на таблата на водачи, со комбиниран резултат кој ги надмина ChatGPT-4o и DeepSeek-R1. Ова е огромно подобрување.
Овој резултат се заснова на сеопфатна евалуација на можностите на големите модели во различни области, вклучувајќи математика, кодирање и повеќејазична обработка.
Цена и перформанси: секоја варијанта на Gemini 2.0 има свои предности
Различните верзии на Gemini 2.0 имаат свои карактеристики во однос на цената и перформансите. Постигнат е баланс помеѓу перформансите и цената, давајќи им на корисниците повеќе избор. API-ите на различните верзии на Gemini 2.0 може да се повикаат преку Google AI Studio и Vertex AI. Програмерите и корисниците можат да ја изберат соодветната верзија според нивните потреби.
Gemini 2.0 направи голем напредок и развој во споредба со Gemini 1.5. Иако различните верзии на Gemini 2.0 имаат разлики, сите тие се целосно подобрени. Поточно, треба да го одредите сценариото што го користите, а потоа подобро да го изберете моделот Gemini кој ви одговара.
Во однос на цената, Gemini 2.0 Flash и Gemini 2.0 Flash – Lite се фокусираат на лесно распоредување. Тие поддржуваат до 1 милион токени во должината на контекстниот прозорец, а во однос на цените, разликата помеѓу обработката на долг и краток текст во Gemini 1.5 Flash е отстранета, а цената е унифицирана по единечна цена на токен.
Gemini 2.0 Flash чини 0,4 американски долари за милион токени за излез на текст, што е половина од цената на Gemini 1.5 Flash при обработка на долги текстови.
Gemini 2.0 Flash – Лајт е уште подобар при оптимизација на трошоците во сценарија за излез на текст од големи размери, со цена на излез на текст од 0,3 американски долари за милион токени. Дури и извршниот директор на Google, Сундар Пичаи, го пофали како „ефикасен и моќен“.
Во однос на подобрувањето на перформансите, Gemini 2.0 Flash има посеопфатни мултимодални функции за интеракција од верзијата Lite. Планирано е да поддржува излез на слика, како и двонасочно во реално време ниско латентно внесување и излез на модалитети како текст, аудио и видео.
Експерименталната верзија на Gemini 2.0 Pro се истакнува во однос на перформансите на кодирање и сложените инструкции. Неговиот контекстен прозорец може да достигне до 2 милиони токени, а неговата општа способност е зголемена од 75,8% на 79,1% во споредба со претходната генерација, што е значајна разлика во способноста за кодирање и расудување со Gemini 2.0 Flash и Gemini 2.0 Flash – Lite.
Апликацискиот тим Gemini рече на платформата X дека корисниците на Gemini Advanced можат да пристапат до експерименталната верзија Gemini 2.0 Pro преку паѓачкото мени за модели, а експерименталната верзија на Gemini 2.0 Flash Thinking е бесплатна за корисниците на апликацијата Gemini, а оваа верзија може да се користи заедно со YouTube, пребарување на Google и Google Maps.
Спротивставување на конкуренцијата: натпревар за економичност на моделот на Google
Во време кога трошоците за развој на модели станаа жешка тема во индустријата, лансирањето на софтверот со отворен код, евтиниот и високи перформанси DeepSeek – R1 имаше влијание врз целата индустрија.
За време на конференцискиот повик по објавувањето на финансискиот извештај на Google за четвртиот квартал за 2024 година, Пичаи, признавајќи ги достигнувањата на DeepSeek, исто така нагласи дека серијата модели Gemini води во рамнотежата помеѓу трошоците, перформансите и доцнењето и дека нивните вкупни перформанси се подобри од оние на моделите V3 и R1 на DeepSeek.
Од гледна точка на рангирањето на репер тестот за изведба на големиот модел LiveBench изграден од Јанг Ликун и неговиот тим, целокупниот ранг на Gemini 2.0 Flash е повисок од оној на DeepSeek V3 и o1 – mini на OpenAI, но тој е зад DeepSeek – R1 и o1 на OpenAI. Сепак, лансирањето на Google на Gemini 2.0 Flash – Lite е како адут. Google се надева дека ќе ги направи најновите големи модели достапни за повеќе луѓе, ќе ги намали трошоците за користење на корисниците и се надева дека ќе заземе место во конкуренцијата меѓу компаниите за цена/перформанси.
Откако Google го објави најновиот Gemini 2.0, Нетизен почна сам да се обидува да ги анализира Gemini 2.0 Flash и другите популарни модели deepseek и openai GPT-4o. Тој откри дека новата верзија на Gemini 2.0 Flash ги надминува другите два модели и во однос на перформансите и трошоците. Ова, исто така, ни дава поглед на развојот и еволуцијата на Google, и тоа е добар почеток.
Поточно, Gemini 2.0 Flash чини 0,1 УСД за милион токени за влез и 0,4 УСД за излез, и двата се далеку пониски од DeepSeek V3. Ова е огромно подобрување и развој. Нетизенот, исто така, истакна на платформата X: „Официјалната верзија на Gemini 2.0 Flash чини една третина од GPT-4o-mini, додека е три пати побрза“.
Нов тренд на големиот пазар на модели: вредноста за парите е крал
Денес, големото моделско поле е фатено во нова ценовна војна. Во минатото, високата цена за користење на големи модели создаде одреден отпор кон нивната употреба и промоција. Влијанието на ценовната војна за големите модели предизвикана од DeepSeek на пазарот на големи модели во странство сè уште продолжува да ферментира. Во исто време, опцијата со отворен код исто така им овозможи на повеќе корисници да ги разберат и користат најновите резултати од истражувањето на големите модели. Стратегијата со отворен код + ниска цена, исто така, изврши притисок врз многу американски големи компании за модели.
Google го лансираше Gemini 2.0 Flash-Lite, а OpenAI ја направи функцијата за пребарување ChatGPT слободно достапна за сите корисници, така што корисниците можат да ја користат функцијата за пребарување за да завршат поразновидни задачи. Внатрешниот тим на Мета исто така го засилува истражувањето за стратегиите за намалување на цените на големите модели, истовремено промовирајќи го понатамошниот развој на големите модели со отворен код на Мета.
Во ова високо конкурентно поле, ниту една компанија не може да седи удобно на првото место. Компаниите се обидуваат да привлечат и задржат корисници преку подобрување на исплатливоста. Овој тренд ќе им помогне на големите модели да преминат од чист технолошки развој кон поширока примена, а идниот пазар на големи модели ќе продолжи да се развива и да се менува во конкуренција за исплатливост.