Високата цена на използването на големи AI модели е основна причина, поради която много AI приложения все още не са внедрени и популяризирани. Изборът на изключителна производителност означава огромни разходи за изчислителна мощност, което води до високи разходи за използване, които обикновените потребители не могат да приемат.
Конкуренцията за големи AI модели е като война без дим. След като DeepSeek пусна и отвори кода най-новия голям модел R1, OpenAI също пусна своя най-нов модел o3 под натиск. Големият модел играч Google също трябваше да се включи в ожесточената конкуренция за евтини модели.
Новият ход на Google: разкрити са нови членове на серията Gemini
Рано сутринта на 6 февруари Google пусна серия от нови версии на модела Gemini. Сред тях е експерименталната версия на Близнаци 2.0 Pro и предварителната версия на Gemini 2.0 Flash – Lite привлякоха голямо внимание и последната версия на Gemini 2.0 Flash беше официално пусната.
Като нов вариант, Google Gemini 2.0 Flash – Lite има много атрактивна цена от само 0,3 USD за милион токени, което го прави най-достъпният модел на Google до момента.
Експерименталната версия на Gemini 2.0 Pro, от друга страна, има мощни собствени мултимодални възможности, които могат да конвертират между текст, аудио и видео.
Експерименталната версия на Gemini 2.0 Flash Thinking е безплатна за използване и също така има възможност за достъп, извличане и обобщаване на съдържанието на видеоклипове в YouTube.
Логан Килпатрик, ръководител на продуктите на Google AI Studio, обяви на платформата X, че тези модели са „най-мощните модели в историята на Google“ и са достъпни за всички разработчици.
Впечатляващото представяне и резултати на новите модели Gemini в класацията
В Chatbot Arena Large Model Leaderboard, Gemini 2.0 Flash Thinking Experimental Edition и Gemini 2.0 Pro Experimental Edition са постигнали изключителни резултати. В сравнение с предишните големи модели на Google, Gemini 2.0 постигна голям напредък и не е изненадващо, че те успешно достигнаха върха на класацията, като комбинираният резултат надмина ChatGPT-4o и DeepSeek-R1. Това е огромно подобрение.
Този резултат се основава на цялостна оценка на възможностите на големи модели в различни области, включително математика, кодиране и многоезична обработка.
Цена и производителност: всеки вариант на Gemini 2.0 има своите предимства
Различните версии на Gemini 2.0 имат свои собствени характеристики по отношение на цена и производителност. Постигнат е баланс между производителност и цена, което дава на потребителите повече възможности за избор. API на различните версии на Gemini 2.0 могат да бъдат извикани чрез Google AI Studio и Vertex AI. Разработчиците и потребителите могат да изберат подходящата версия според нуждите си.
Gemini 2.0 отбеляза голям напредък и развитие в сравнение с Gemini 1.5. Въпреки че различните версии на Gemini 2.0 имат разлики, всички те са подобрени като цяло. По-конкретно, трябва да определите сценария, който използвате, и след това можете по-добре да изберете модела Gemini, който ви подхожда.
По отношение на цената, Gemini 2.0 Flash и Gemini 2.0 Flash – Lite се фокусират върху лекото внедряване. Те поддържат до 1 милион жетони в дължината на контекстния прозорец, а по отношение на ценообразуването разграничението между дълга и кратка обработка на текст в Gemini 1.5 Flash е премахнато и цената е унифицирана на единична цена на жетона.
Gemini 2.0 Flash струва 0,4 USD на милион жетони за текстов изход, което е половината от цената на Gemini 1.5 Flash при обработка на дълги текстове.
Gemini 2.0 Flash – Lite е дори по-добър при оптимизиране на разходите в мащабни сценарии за извеждане на текст, с ценообразуване на изходен текст от 0,3 USD за милион токени. Дори изпълнителният директор на Google Сундар Пичай го похвали като „ефективен и мощен“.
По отношение на подобряването на производителността, Gemini 2.0 Flash има по-изчерпателни функции за мултимодално взаимодействие от версията Lite. Планирано е да поддържа извеждане на изображения, както и двупосочно въвеждане и извеждане в реално време с ниска латентност на модалности като текст, аудио и видео.
Експерименталната версия на Gemini 2.0 Pro превъзхожда по отношение на производителността на кодирането и сложните подкани. Неговият контекстен прозорец може да достигне до 2 милиона токена, а общата му способност се е увеличила от 75.8% на 79.1% в сравнение с предишното поколение, което е значителна разлика в способността за кодиране и разсъждение с Gemini 2.0 Flash и Gemini 2.0 Flash – Lite.
Екипът на приложението Gemini каза за платформата X, че потребителите на Gemini Advanced имат достъп до експерименталната версия на Gemini 2.0 Pro чрез падащото меню на модела, а експерименталната версия на Gemini 2.0 Flash Thinking е безплатна за потребителите на приложението Gemini и тази версия може да се използва във връзка с YouTube, Google търсене и Google Maps.
Противодействие на конкуренцията: конкурс за рентабилност на модела на Google
Във време, когато разходите за разработване на модели се превърнаха в гореща тема в индустрията, пускането на отворения код, евтин, високопроизводителен DeepSeek – R1 оказа влияние върху цялата индустрия.
По време на конферентния разговор след публикуването на финансовия отчет на Google за четвъртото тримесечие на 2024 г., Pichai, макар да признава постиженията на DeepSeek, също така подчерта, че серията модели Gemini е водеща в баланса между цена, производителност и латентност и че цялостната им производителност е по-добра от тази на моделите V3 и R1 на DeepSeek.
От гледна точка на класирането на сравнителния тест за производителност на голям модел LiveBench, изграден от Янг Ликун и неговия екип, общото класиране на Gemini 2.0 Flash е по-високо от това на DeepSeek V3 и o1 – mini на OpenAI, но е зад DeepSeek – R1 и o1 на OpenAI. Пускането на Gemini 2.0 Flash – Lite от Google обаче е като коз. Google се надява да направи най-новите големи модели достъпни за повече хора, да намали разходите за използване на потребителите и се надява да заеме място в конкуренцията между компаниите за цена/производителност.
След като Google пусна най-новата Gemini 2.0, един потребител на мрежата започна сам да опитва и анализира Gemini 2.0 Flash и други популярни модели deepseek и openai GPT-4o. Той установи, че новата версия на Gemini 2.0 Flash превъзхожда другите два модела по отношение на производителност и цена. Това също така ни дава представа за развитието и еволюцията на Google и е добро начало.
По-конкретно, Gemini 2.0 Flash струва 0,1 USD на милион токени за въвеждане и 0,4 USD за изход, като и двете са много по-ниски от DeepSeek V3. Това е огромно подобрение и развитие. Netizen също посочи за платформата X: „Официалната версия на Gemini 2.0 Flash струва една трета от GPT-4o-mini, докато е три пъти по-бърза.“
Нова тенденция в големия пазар на модели: съотношението цена-качество е най-важното
Днес голямото моделно поле е въвлечено в нова ценова война. В миналото високата цена на използването на големи модели създаде известна съпротива срещу тяхното използване и популяризиране. Въздействието на ценовата война за големи модели, предизвикана от DeepSeek върху задграничния пазар на големи модели, все още продължава да ферментира. В същото време опцията с отворен код също така позволи на повече потребители да разберат и използват най-новите резултати от изследване на голям модел. Стратегията с отворен код + ниска цена също оказва натиск върху много американски големи компании за модели.
Google стартира Gemini 2.0 Flash-Lite, а OpenAI направи функцията за търсене ChatGPT безплатно достъпна за всички потребители, така че потребителите да могат да използват функцията за търсене, за да изпълняват по-разнообразни задачи. Вътрешният екип на Meta също засилва изследванията на стратегии за намаляване на цените на големи модели, като същевременно насърчава по-нататъшното развитие на големите модели с отворен код на Meta.
В тази силно конкурентна област никоя компания не може да се настани удобно на първо място. Компаниите се опитват да привлекат и задържат потребители чрез подобряване на рентабилността. Тази тенденция ще помогне на големите модели да преминат от чисто технологично развитие към по-широко приложение, а бъдещият пазар на големи модели ще продължи да се развива и променя в конкуренцията за рентабилност.