Некатегоризирано

Пресметката на четирите најдобри модели! Преглед покажува колку е моќен Deepseek R1

Од страна наzddeepseeker 1 јуни 2025 година1 јуни 2025 година

Во текот на изминатите неколку дена, Deepseek-R1 0528 официјално е достапен со отворен код. На LiveCodeBench, неговите перформанси се речиси на исто ниво со o3 на OpenAI (високи); во повеќејазичниот тест на Aider, тој е во конкуренција со Claude Opus. Кога беше лансиран на официјалната веб-страница, брзо ги тестиравме неговите можности за front-end и откривме дека се исклучително...

Некатегоризирано

DeepSeek-R1-0528 Ажурирање: Подлабоко размислување, посилно расудување

Од страна наzddeepseeker 29 мај 2025 година29 мај 2025 година

Моделот DeepSeek R1 претрпе мало надградување на верзијата, при што моменталната верзија е DeepSeek-R1-0528. Кога ќе влезете на веб-страницата или апликацијата DeepSeek, овозможете ја функцијата „Длабоко размислување“ во интерфејсот за дијалог за да ја доживеете најновата верзија. Тежините на моделот DeepSeek-R1-0528 се прикачени на HuggingFace Во текот на изминатите четири месеци, DeepSeek-R1 претрпе…

Некатегоризирано

DeepSeek го објави својот изворен код, детално објаснување за FlashMLA

Од страна наzddeepseeker 24 февруари 2025 година24 февруари 2025 година

Минатата недела, DeepSeek објави дека следната недела ќе отвори пет проекти со отворен код: Нетизените рекоа: „Овој пат, OpenAI е навистина тука“. Токму сега, дојде првиот проект со отворен код, поврзан со забрзувањето на заклучоците, FlashMLA: Адреса на проектот со отворен код: DeepSeek FlashMLA Тој е со отворен код веќе два часа, а Github веќе има 2,7k+ ѕвезди: The…

Некатегоризирано

Што е FlashMLA? Сеопфатен водич за неговото влијание врз кернелите за декодирање на вештачката интелигенција

Од страна на1TP7 Тер 24 февруари 2025 година24 февруари 2025 година

FlashMLA брзо привлече внимание во светот на вештачката интелигенција, особено во областа на големи јазични модели (LLMs). Оваа иновативна алатка, развиена од DeepSeek, служи како оптимизирано јадро за декодирање дизајнирано за графички процесори на Hopper - чипови со високи перформанси кои вообичаено се користат во пресметките со вештачка интелигенција. FlashMLA се фокусира на ефикасна обработка на секвенци со променлива должина, што го прави особено добро прилагоден…

Некатегоризирано

Qwen2.5-max vs DeepSeek R1: Длабока споредба на модели: целосна анализа на сценаријата на апликацијата

Од страна наzddeepseeker 14 февруари 2025 година14 февруари 2025 година

Вовед Денес, големите јазични модели (LLMs) играат клучна улога. На почетокот на 2025 година, како што се засили конкуренцијата за вештачка интелигенција, Alibaba го лансираше новиот модел Qwen2.5-max AI, а DeepSeek, компанија од Хангжу, Кина, го лансираше моделот R1, кој го претставува врвот на технологијата LLM. Deepseek R1 е модел со вештачка интелигенција со отворен код кој привлече…

Некатегоризирано

Блиску е до DeepSeek-R1-32B и го скрши s1 на Fei-Fei Li! UC Berkeley и други нови модели на SOTA заклучоци со отворен код

Од страна наzddeepseeker 14 февруари 2025 година14 февруари 2025 година

Моделот за заклучување 32B користи само 1/8 од податоците и е врзан со DeepSeek-R1 со иста големина! Токму сега, институциите како што се Стенфорд, УК Беркли и Универзитетот во Вашингтон заеднички објавија модел за заклучување на ниво на SOTA, OpenThinker-32B, а исто така имаат отворен извор до 114k податоци за обука. Почетна страница на проектот OpenThinker: Лице гушкање OpenThinker:…

Некатегоризирано

Артефакти за управување со големи јазични модели како што се DeepSeek: Cherry Studio, Chatbox, AnythingLLM, кој е вашиот забрзувач за ефикасност?

Од страна наzddeepseeker 11 февруари 2025 година11 февруари 2025 година

Многу луѓе веќе почнаа локално да ги распоредуваат и користат Deepseek Large Language Models, користејќи го Chatbox како алатка за визуелизација Оваа статија ќе продолжи да воведува два други артефакти за управување и визуелизација на моделот на големи јазици со вештачка интелигенција и ќе ги спореди трите детално за да ви помогне поефикасно да ги користите моделите со големи јазици со вештачка интелигенција. Во 2025 година,…

Некатегоризирано

Le Chat е на врвот на топ листите, со инвестиции од сто милијарди долари. По САД и Кина, дали е тоа трета сила на вештачката интелигенција?

Од страна наzddeepseeker 11 февруари 2025 година11 февруари 2025 година

На 9 февруари, францускиот претседател Емануел Макрон објави дека Франција ќе инвестира 109 милијарди евра (113 милијарди американски долари) во областа на вештачката интелигенција во следните неколку години. Оваа инвестиција ќе биде искористена за изградба на парк за вештачка интелигенција во Франција, подобрување на инфраструктурата и инвестирање во локални стартапи за вештачка интелигенција. Во меѓувреме, Мистрал, француски стартап,…

Некатегоризирано

Што може да постигне Deepseek? Дури и OpenAI не може да го направи тоа?

Од страна наzddeepseeker 10 февруари 2025 година10 февруари 2025 година

Вистинската вредност на DeepSeek е потценета! DeepSeek-R1 несомнено донесе нов бран на ентузијазам на пазарот. Не само што релевантните таканаречени цели на корисници нагло се зголемуваат, туку некои луѓе дури развија курсеви и софтвер поврзани со DeepSeek во обид да заработат пари од тоа. Сметаме дека иако овие појави имаат…

Некатегоризирано

Главните светски производи со вештачка интелигенција се фокусираат на анализа и сеопфатни упатства за корисничко искуство (вклучувајќи DeepSeek и GPT)

Од страна наzddeepseeker 10 февруари 2025 година10 февруари 2025 година

Позиционирање на функции и анализа на основните предности ChatGPT (OpenAI) – глобален репер за сеопфатни ChatGPT Технички гени: генеративна вештачка интелигенција базирана на серијата големи модели на GPT, со општи вештини за разговор и логично расудување како основни предности. Повеќејазична обработка: најдобро функционира на англиски, со континуирано подобрување на кинескиот; но препорачуваме да го користиме англискиот јазик за да…