Google објави три нови модели одеднаш: Gemini-2.0-Pro е бесплатен, има извонреден резултат и се рангира на прво место и е погоден за кодирање и обработка на сложени инструкции!

Приказната за Геми n јас 2.0 се забрзува.

Flash Thinking Experimental верзијата во декември им донесе на програмерите работен модел со мала латентност и високи перформанси.

Претходно оваа година, 2.0 Flash Thinking Experimental беше ажуриран во Google AI Studio за дополнително подобрување на перформансите со комбинирање на брзината на Flash со подобрени способности за заклучување.

Минатата недела, ажурираната верзија 2.0 Flash беше целосно лансирана на Gemini десктоп и мобилни апликации.

Денеска беа претставени три нови членови во исто време: експерименталната верзија на Gemini 2.0 Pro, која досега се покажа најдобро во кодирањето и сложените инструкции, исплатливиот 2.0 Flash-Lite и верзијата 2.0 Flash Thinking засилена со размислување.

Gemini 2.0 Pro е на прво место во сите категории. Gemini-2.0-Flash е рангирана во првите три во кодирање, математика и загатки. Flash-lite се рангира во првите десет во сите категории.

Споредбена табела на способностите на трите модели:

Сите модели поддржуваат мултимодален влез и излез на текст.

Повеќе модални способности се на пат. Табела за јачина на моделот во арената за кодирање

Топлинска карта со стапка на победа

Google ги третира бесплатните корисници подобро отколку OpenAI кон корисниците на Plus. Бесплатен пристап до Gemini 2.0 Pro Experimental во AI Studio:

Кликнете за да играте

Услугата Deepseek секогаш прикажува грешка на чекање... Запомнете дека првиот модел без заклучоци беше исто така 2.0 Flash Thinking, кој се користеше во Google aistudio.

Покрај тоа, постои и веб верзија на Близнаци:

Исто така, постои поврзан модел на заклучоци (па зошто да го одделите…)

Google ја објави експерименталната верзија на Gemini 2.0 Pro, а подобрувањето на официјалните бенчмарк тестови е прилично привлечно.

Ги има најмоќните способности за кодирање и способност да обработува сложени потсетници и има подобра способност да разбере и расудува за светското знаење од кој било модел објавен од Google досега.

Има најголем контекстен прозорец (200k, а мојот долг контекст е релативно голема предност на моделот Gemini), што му овозможува сеопфатно да анализира и разбере голема количина на информации и да повикува алатки како што се пребарување на Google и извршување на код.

Во тестот по МАТЕМАТИКА, тој постигна 91,8%, што претставува зголемување од околу 5 процентни поени во однос на верзијата 1.5. Способноста за расудување GPQA достигна 64,7%, а тестот за светско знаење SimpleQA достигна дури 44,3%.

Најзабележителна е способноста за програмирање. Постигна 36,0% во тестот LiveCodeBench, а точноста на конверзијата Bird-SQL надмина 59,3%. Заедно со супер-големиот контекстен прозорец од 2 милиони токени, доволно е да се справите со најсложените задачи за анализа на кодот.

Можете да го пробате во курсорот.

Способноста за разбирање на повеќе јазици е исто така импресивна, со глобален резултат на тестот MMLU од 86,5%. MMMU за разбирање на слики е 72,7%, а способноста за видео анализа е 71,9%.

Gemini 2.0 Flash-Lite е интересен биланс.

Ја одржува брзината и цената на 1,5 Flash, но носи подобри перформанси. Контексниот прозорец со 1 милион токени му овозможува да обработи повеќе информации.

Најпрактично е неговиот сооднос цена/перформанси: генерирањето натписи за 40.000 фотографии чини помалку од $1. Ова ја прави вештачката интелигенција поприземна.

Блогерката Шривастава спомна: Кодирањето Gemini 2.0 Pro е лудо!

Совет: користете Three.js за да креирате симулација на Сончевиот систем. Додајте временска скала, паѓачко мени за фокусирање, прикажувајте орбити и прикажувајте етикети. Направете сè во една датотека за да можам да ја залепам во онлајн уредник и да го прегледам излезот.

Покрај тоа, некои корисници спомнаа дека Gemini 2.0 Flash даде подобри резултати во еден од неговите сопствени тестови за парадокс:

Конечно, Google спомена дека безбедноста на Gemini 2.0, а не само закрпата, е во сржта на дизајнот од самиот почеток.

Нека моделот научи да биде самокритичен. Користете го учењето за засилување за да му дозволите на Близнаците да ги проценат сопствените одговори и да дадат попрецизни повратни информации. Ова го прави поробустен кога се занимавате со чувствителни теми.

Интересно е автоматизираното тестирање на црвениот тим. Специјално е дизајниран да спречи вбризгување на индиректни брзи зборови, што е како опремување на вештачката интелигенција со имунолошки систем за да спречи некој да крие злонамерни команди во податоците.

Некатегоризирано

Алтман: Згрешивме за вештачката интелигенција со отворен код! DeepSeek го направи OpenAI помалку поволен, а следниот е GPT-5

Од страна наzddeepseeker 1 февруари 2025 година1 февруари 2025 година

o3-mini пристигна доцна во ноќта, а OpenAI конечно го откри својот најнов адут. За време на Reddit AMA Q&A, Алтман длабоко призна дека застанал на погрешната страна на вештачката интелигенција со отворен код. Тој рече дека се разгледува внатрешната стратегија на отворен код, а моделот ќе продолжи да се развива, но…

Некатегоризирано

Прво лансирање! SiliconFlow X Huawei Cloud заеднички ги лансираше услугите за заклучување DeepSeek R1 и V3 базирани на Ascend Cloud!

Од страна наzddeepseeker 1 февруари 2025 година1 февруари 2025 година

DeepSeek-R1 и DeepSeek-V3 предизвикаа глобална сензација од нивното лансирање со отворен код. Тие се подарок од тимот на DeepSeek за целото човештво и ние сме искрено среќни за нивниот успех. По неколкудневна напорна работа од тимовите на Silicon Mobility и Huawei Cloud, денес на кинеските корисници им даваме и кинески…

Некатегоризирано

Главните светски производи со вештачка интелигенција се фокусираат на анализа и сеопфатни упатства за корисничко искуство (вклучувајќи DeepSeek и GPT)

Од страна наzddeepseeker 10 февруари 2025 година10 февруари 2025 година

Позиционирање на функции и анализа на основните предности ChatGPT (OpenAI) – глобален репер за сеопфатни ChatGPT Технички гени: генеративна вештачка интелигенција базирана на серијата големи модели на GPT, со општи вештини за разговор и логично расудување како основни предности. Повеќејазична обработка: најдобро функционира на англиски, со континуирано подобрување на кинескиот; но препорачуваме да го користиме англискиот јазик за да…

Некатегоризирано

Le Chat е на врвот на топ листите, со инвестиции од сто милијарди долари. По САД и Кина, дали е тоа трета сила на вештачката интелигенција?

Од страна наzddeepseeker 11 февруари 2025 година11 февруари 2025 година

На 9 февруари, францускиот претседател Емануел Макрон објави дека Франција ќе инвестира 109 милијарди евра (113 милијарди американски долари) во областа на вештачката интелигенција во следните неколку години. Оваа инвестиција ќе биде искористена за изградба на парк за вештачка интелигенција во Франција, подобрување на инфраструктурата и инвестирање во локални стартапи за вештачка интелигенција. Во меѓувреме, Мистрал, француски стартап,…

Некатегоризирано

DeepSeek TOP17 Најдобри алтернативи: сеопфатна анализа (2025)

Од страна на1TP7 Тер 6 февруари 2025 година6 февруари 2025 година

Вовед Во пејзажот на вештачката интелигенција кој брзо се развива, DeepSeek се појави како моќен јазичен модел. Оваа сеопфатна анализа ги истражува најдобрите 17 алтернативи на DeepSeek, испитувајќи ги нивните уникатни карактеристики, способности и случаи на употреба. Нашето истражување се фокусира и на меѓународни и на кинески платформи кои нудат интеграција на DeepSeek или слични способности. Анализа на врвни алтернативи 1….

Некатегоризирано

Ali Qwen2.5-Max го престигна DeepSeek-V3! Нетизен: Кинеската вештачка интелигенција брзо го намалува јазот

Од страна наzddeepseeker 5 февруари 2025 година5 февруари 2025 година

Само сега, на листата на Big Model Arena беше додаден уште еден домашен модел од Ali, Qwen2.5-Max, кој го надмина DeepSeek-V3 и се најде на седмото место во вкупната ранг-листа со вкупен резултат од 1332. Исто така, ги надмина моделите како Claude 3.5 Sonnet и Llama 3.1 inwop 40 Особено, тој се истакнува во програмирањето…

Слични објави

Напишете коментар Откажи одговор