Недорогая модель Google, серия Gemini 2.0, наступает: битва за экономическую эффективность в крупных моделях усиливается

Высокая стоимость использования больших моделей ИИ является основной причиной, по которой многие приложения ИИ до сих пор не внедрены и не продвигаются. Выбор экстремальной производительности означает огромные затраты вычислительной мощности, что приводит к высоким расходам на использование, которые обычные пользователи не могут принять.

Конкуренция за большие модели ИИ — это как война без дыма. После того, как DeepSeek выпустила и открыла исходный код последней большой модели R1, OpenAI также выпустила свою последнюю модель o3 под давлением. Игроку в области больших моделей Google также пришлось присоединиться к жесткой конкуренции за недорогие модели.

Оглавление

Новый ход Google: представлены новые участники серии Gemini

Ранним утром 6 февраля Google запустила серию новых версий модели Gemini. Среди них экспериментальная версия Близнецы 2.0 Pro и предварительная версия Gemini 2.0 Flash – Lite привлекли большое внимание, и последняя версия Gemini 2.0 Flash была официально выпущена.

Как новый вариант, Google Близнецы 2.0 Flash – Lite имеет очень привлекательную цену всего 0,3 доллара США за миллион токенов, что делает ее самой доступной моделью Google на сегодняшний день.

С другой стороны, экспериментальная версия Gemini 2.0 Pro обладает мощными встроенными мультимодальными возможностями, которые позволяют преобразовывать текст в аудио и видео.

Экспериментальная версия Gemini 2.0 Flash Thinking доступна бесплатно и также позволяет получать доступ, извлекать и обобщать содержание видеороликов YouTube.

Логан Килпатрик, руководитель продуктов Google AI Studio, объявил на платформе X, что эти модели являются «самыми мощными моделями в истории Google» и доступны всем разработчикам.

Впечатляющие характеристики и результаты новых моделей Gemini в таблице лидеров

В рейтинге Chatbot Arena Large Model Leaderboard Gemini 2.0 Flash Thinking Experimental Edition и Gemini 2.0 Pro Experimental Edition добились выдающихся результатов. По сравнению с предыдущими крупными моделями Google, Gemini 2.0 добились большого прогресса, и неудивительно, что они успешно достигли вершины рейтинга, превзойдя ChatGPT-4o и DeepSeek-R1. Это огромное улучшение.

Этот результат основан на комплексной оценке возможностей больших моделей в различных областях, включая математику, кодирование и многоязыковую обработку.

Цена и производительность: каждый вариант Gemini 2.0 имеет свои преимущества

Различные версии Gemini 2.0 имеют свои особенности с точки зрения цены и производительности. Был достигнут баланс между производительностью и ценой, что дает пользователям больше выбора. API различных версий Gemini 2.0 можно вызывать через Google AI Studio и Vertex AI. Разработчики и пользователи могут выбрать подходящую версию в соответствии со своими потребностями.

Gemini 2.0 достигла большого прогресса и развития по сравнению с Gemini 1.5. Хотя разные версии Gemini 2.0 имеют различия, все они были улучшены в целом. В частности, вам нужно определить сценарий, который вы используете, и тогда вы сможете лучше выбрать модель Gemini, которая вам подходит.

С точки зрения цены Gemini 2.0 Flash и Gemini 2.0 Flash – Lite ориентированы на легкое развертывание. Они поддерживают до 1 миллиона токенов в длине контекстного окна, а с точки зрения ценообразования различие между длинной и короткой обработкой текста в Gemini 1.5 Flash было удалено, а цена унифицирована по цене за единицу токена.

Стоимость Gemini 2.0 Flash составляет 0,4 доллара США за миллион токенов для вывода текста, что вдвое меньше стоимости Gemini 1.5 Flash при обработке длинных текстов.

Gemini 2.0 Flash – Lite еще лучше с точки зрения оптимизации затрат в сценариях крупномасштабного текстового вывода, с ценой текстового вывода 0,3 USD за миллион токенов. Даже генеральный директор Google Сундар Пичаи похвалил его как «эффективный и мощный».

С точки зрения улучшения производительности Gemini 2.0 Flash имеет более комплексные функции мультимодального взаимодействия, чем версия Lite. Планируется, что он будет поддерживать вывод изображений, а также двунаправленный ввод и вывод в реальном времени с низкой задержкой модальностей, таких как текст, аудио и видео.

Экспериментальная версия Gemini 2.0 Pro выделяется производительностью кодирования и сложными подсказками. Ее контекстное окно может достигать 2 миллионов токенов, а ее общая способность увеличилась с 75,8% до 79,1% по сравнению с предыдущим поколением, что является существенной разницей в способности кодирования и рассуждения с Gemini 2.0 Flash и Gemini 2.0 Flash – Lite.

Команда приложения Gemini заявила на платформе X, что пользователи Gemini Advanced могут получить доступ к экспериментальной версии Gemini 2.0 Pro через раскрывающееся меню моделей, а экспериментальная версия Gemini 2.0 Flash Thinking бесплатна для пользователей приложения Gemini, и эту версию можно использовать совместно с YouTube, поиском Google и картами Google.

Противодействие конкуренции: конкурс на экономическую эффективность модели Google

В то время, когда стоимость разработки модели стала актуальной темой в отрасли, запуск недорогой и высокопроизводительной модели с открытым исходным кодом DeepSeek – R1 оказал влияние на всю отрасль.

В ходе телефонной конференции после публикации финансового отчета Google за четвертый квартал 2024 года Пичаи, признавая достижения DeepSeek, также подчеркнул, что модели серии Gemini лидируют по балансу между стоимостью, производительностью и задержкой, и что их общая производительность лучше, чем у моделей DeepSeek V3 и R1.

С точки зрения рейтинга теста производительности большой модели LiveBench, созданного Янгом Ликуном и его командой, общий рейтинг Gemini 2.0 Flash выше, чем у DeepSeek V3 и o1 – mini от OpenAI, но он отстает от DeepSeek – R1 и o1 от OpenAI. Однако запуск Gemini 2.0 Flash – Lite от Google – это как козырная карта. Google надеется сделать новейшие большие модели доступными для большего числа людей, снизить расходы пользователей на использование и надеется занять место в конкурентной борьбе между компаниями по соотношению цена/производительность.

После того, как Google выпустил последняя версия Gemini 2.0, пользователь сети начал пытаться анализировать Gemini 2.0 Flash и другие популярные модели deepseek и openai GPT-4o самостоятельно. Он обнаружил, что новая версия Gemini 2.0 Flash превосходит две другие модели как по производительности, так и по стоимости. Это также дает нам представление о развитии и эволюции Google, и это хорошее начало.

В частности, Gemini 2.0 Flash стоит 0,1 USD за миллион токенов на входе и 0,4 USD на выходе, что намного ниже, чем DeepSeek V3. Это огромное улучшение и развитие. Пользователь сети также указал на платформу X: «Официальная версия Gemini 2.0 Flash стоит одну треть от GPT-4o-mini, хотя она в три раза быстрее».

Новая тенденция на рынке больших моделей: соотношение цены и качества превыше всего

Сегодня область больших моделей оказалась втянутой в новую ценовую войну. В прошлом высокая стоимость использования больших моделей создавала некоторое сопротивление их использованию и продвижению. Влияние ценовой войны для больших моделей, спровоцированной DeepSeek на зарубежном рынке больших моделей, все еще продолжает бродить. В то же время опция с открытым исходным кодом также позволила большему количеству пользователей понять и использовать последние результаты исследований больших моделей. Стратегия с открытым исходным кодом и низкой ценой также оказала давление на многие американские компании, занимающиеся большими моделями.

Google запустил Gemini 2.0 Flash-Lite, а OpenAI сделал функцию поиска ChatGPT свободно доступной для всех пользователей, чтобы пользователи могли использовать функцию поиска для выполнения более разнообразных задач. Внутренняя команда Meta также активизирует исследования стратегий снижения цен на большие модели, одновременно продвигая дальнейшее развитие больших моделей с открытым исходным кодом Meta.

В этой высококонкурентной области ни одна компания не может комфортно сидеть на первом месте. Компании пытаются привлечь и удержать пользователей, повышая рентабельность. Эта тенденция поможет крупным моделям перейти от чистой разработки технологий к более широкому применению, и будущий рынок крупных моделей продолжит развиваться и меняться в конкуренции за рентабельность.

Недорогая модель Google серии Gemini 2.0 наступает: борьба за экономическую эффективность в крупных моделях усиливается

Новый ход Google: представлены новые участники серии Gemini

Впечатляющие характеристики и результаты новых моделей Gemini в таблице лидеров

Цена и производительность: каждый вариант Gemini 2.0 имеет свои преимущества

Противодействие конкуренции: конкурс на экономическую эффективность модели Google

Новая тенденция на рынке больших моделей: соотношение цены и качества превыше всего

DeepSeek опубликовал свой исходный код, подробное объяснение FlashMLA

Интерпретация доклада DeepSeek R1 и ключевые технические моменты

Как была создана компания DeepSeek? Анализ истории развития DeepSeek

Основные мировые продукты ИИ сосредоточены на анализе и комплексных рекомендациях по пользовательскому опыту (включая DeepSeek и GPT)

Qwen2.5-max против DeepSeek R1: Глубокое сравнение моделей: полный анализ сценариев применения

Он близок к DeepSeek-R1-32B и превосходит s1 Фэй-Фэй Ли! Калифорнийский университет в Беркли и другие новые модели вывода SOTA с открытым исходным кодом

Добавить комментарий Отменить ответ

Новый ход Google: представлены новые участники серии Gemini

Впечатляющие характеристики и результаты новых моделей Gemini в таблице лидеров

Цена и производительность: каждый вариант Gemini 2.0 имеет свои преимущества

Противодействие конкуренции: конкурс на экономическую эффективность модели Google

Новая тенденция на рынке больших моделей: соотношение цены и качества превыше всего

Похожие записи

Добавить комментарий Отменить ответ