zddeepseeker - Deepseek R1 - Страница 2 от 3

Без категория

Разкрита е технологията DeepSeek-R1: основните принципи на хартията са разбити и е разкрит ключът към пробивното представяне на модела

Отzddeepseeker 9 февруари 2025 г9 февруари 2025 г

Днес ще споделим DeepSeek R1, заглавие: DeepSeek-R1: Стимулиране на способността за разсъждение в LLMs чрез Reinforcement Learning: Стимулиране на способността за разсъждение на LLM чрез подсилващо обучение. Този документ представя първото поколение модели на разсъждение на DeepSeek, DeepSeek-R1-Zero и DeepSeek-R1. Моделът DeepSeek-R1-Zero беше обучен чрез широкомащабно обучение с подсилване (RL) без контролирана фина настройка (SFT) като начална стъпка,...

Без категория

DeepSeek R1 тълкуване на хартия и ключови технически точки

Отzddeepseeker 9 февруари 2025 г9 февруари 2025 г

1 История По време на Пролетния фестивал DeepSeek R1 отново привлече широко внимание и дори статията за интерпретация на DeepSeek V3, която написахме по-рано, също беше препредадена и обсъждана много. Въпреки че има много анализи и репродукции на DeepSeek R1, тук решихме да съставим някои съответни бележки за четене. Ще използваме три…

Евтиният модел на Google, серията Gemini 2.0, атакува: битката за рентабилност при големите модели се засилва

Без категория

Евтиният модел на Google, серията Gemini 2.0, атакува: битката за рентабилност при големите модели се засилва

Отzddeepseeker 8 февруари 2025 г8 февруари 2025 г

Високата цена на използването на големи AI модели е основна причина, поради която много AI приложения все още не са внедрени и популяризирани. Изборът на изключителна производителност означава огромни разходи за изчислителна мощност, което води до високи разходи за използване, които обикновените потребители не могат да приемат. Конкуренцията за големи AI модели е като война без дим. след…

Gemini 2.0 доминира в класациите, докато DeepSeek V3 плаче в цената си и се ражда нов рентабилен шампион!

Без категория

Gemini 2.0 доминира в класациите, докато DeepSeek V3 плаче в цената си и се ражда нов рентабилен шампион!

Отzddeepseeker 8 февруари 2025 г8 февруари 2025 г

Семейството Google Gemini 2.0 най-накрая е завършено! Той доминира в класациите веднага след като е пуснат. На фона на преследването и блокадите на Deepseek, Qwen и o3, Google пусна три модела наведнъж рано тази сутрин: Gemini 2.0 Pro, Gemini 2.0 Flash и Gemini 2.0 Flash-Lite. В класацията на големия модел LMSYS, Gemini...

a16z диалог с 27-годишен изпълнителен директор: AI Agent има огромен ливъридж ефект и дългосрочното ценообразуване ще бъде свързано с разходите за труд

Без категория

a16z диалог с 27-годишен изпълнителен директор: AI Agent има огромен ливъридж ефект и дългосрочното ценообразуване ще бъде свързано с разходите за труд

Отzddeepseeker 8 февруари 2025 г8 февруари 2025 г

Акценти AI Agent променя клиентското изживяване Джеси Джан: Как всъщност се изгражда агент? Нашето мнение е, че с течение на времето той ще става все повече и повече като агент, базиран на естествен език, защото така се обучават големите езикови модели (LLM). В дългосрочен план, ако имате супер интелигентен агент, който...

Без категория

Кати Ууд: DeepSeek просто ускорява процеса на намаляване на разходите; изключително концентрираната пазарна структура, сравнима с Голямата депресия, ще се промени

Отzddeepseeker 8 февруари 2025 г8 февруари 2025 г

Акценти Конкуренцията с DeepSeek е добра за САЩ Кати Ууд: Мисля, че това показва, че цената на иновациите пада драстично и че тази тенденция вече е започнала. Например, преди DeepSeek, разходите за обучение на изкуствен интелект паднаха със 75% на година, а разходите за изводи дори паднаха с 85% до...

Без категория

Google пусна три нови модела наведнъж: Gemini-2.0-Pro е безплатен, има изключителен резултат и е на първо място и е подходящ за кодиране и обработка на сложни подкани!

Отzddeepseeker 8 февруари 2025 г8 февруари 2025 г

Историята на Gemini 2.0 се ускорява. Експерименталната версия на Flash Thinking Experimental през декември донесе на разработчиците работещ модел с ниска латентност и висока производителност. По-рано тази година 2.0 Flash Thinking Experimental беше актуализиран в Google AI Studio за допълнително подобряване на производителността чрез комбиниране на скоростта на Flash с подобрени възможности за извод. Миналата седмица,…

Без категория

Ali Qwen2.5-Max изпреварва DeepSeek-V3! Netizen: Китайският AI бързо намалява разликата

Отzddeepseeker 5 февруари 2025 г5 февруари 2025 г

Току-що друг местен модел беше добавен към списъка на Big Model Arena от Ali, Qwen2.5-Max, който надмина DeepSeek-V3 и се класира на седмо място в общата класация с общ резултат от 1332. Той също така надмина модели като Claude 3.5 Sonnet и Llama 3.1 405B с един замах. По-специално, той е отличен в програмирането...

Извънредни новини! Изследователят на DeepSeek разкрива онлайн: R1 обучението отне само две до три седмици и мощна еволюция на R1 нула беше наблюдавана по време на празника на китайската Нова година

Без категория

Извънредни новини! Изследователят на DeepSeek разкрива онлайн: R1 обучението отне само две до три седмици и мощна еволюция на R1 нула беше наблюдавана по време на празника на китайската Нова година

Отzddeepseeker 4 февруари 2025 г4 февруари 2025 г

Извънредни новини! Изследователят на DeepSeek разкрива онлайн: Обучението на R1 отне само две до три седмици и мощна еволюция на R1 нула беше наблюдавана по време на празника на китайската Нова година Току-що забелязахме, че изследователят на DeepSeek Daya Guo отговори на въпросите на нетизените относно DeepSeek R1 и плановете на компанията върви напред. Можем само да кажем…

DeepSeek R1 е на първо място в теста по творческо писане, а o3 mini е дори по-зле от o1 mini!

Без категория

DeepSeek R1 е на първо място в теста по творческо писане, а o3 mini е дори по-зле от o1 mini!

Отzddeepseeker февруари 3, 2025 г.февруари 3, 2025 г.

DeepSeek R1 спечели шампионата в теста за творческо писане на кратки истории, като успешно надмина предишния доминиращ играч Claude 3.5 Sonnet! Сравнителен тест Сравнителният тест, разработен от изследователя Лех Мазур, не е обикновено състезание по писане. От всеки модел на изкуствен интелект се изискваше да изпълни 500 кратки разказа, като всеки разказ трябваше умело да включва...