DeepSeek R1 онлајн (бесплатно|нологин)
Револуционерен модел на вештачка интелигенција со отворен извор за напредно расудување што го надминува Openai o1

DeepSeek R1 Разговор онлајн бесплатно
DeepSeek R1 WEBGPU онлајн
Модел за расудување од следната генерација што работи локално во вашиот прелистувач со забрзување на WebGPU.
Ќе го вчитате DeepSeek-R1-Distill-Qwen-1.5B, 1.5B параметар расудување LLM оптимизиран за заклучоци во прелистувачот. Сè работи целосно во вашиот прелистувач со 🤗 Transformers.js и ONNX Runtime Web, што значи дека не се испраќаат податоци до серверот. Откако ќе се вчита, може да се користи дури и офлајн.

Агент за кодирање со вештачка интелигенција Powered BY DeepSeek онлајн бесплатно сега!
Болтњу.ai се напојува со deepseek V3, е алатка за генерирање кодови, сега е бесплатна!






Функција спакувана од DeepSeek R1 онлајн
Архитектура
Вграден на МЕ (Мешавина на експерти) со 37B активни/671B вкупни параметри и 128K должина на контекстот. Спроведува напредно учење за зајакнување за да постигне самопроверка, размислување во повеќе чекори и способности за расудување усогласено со човекот.
Изведба
Математика: 97,3% точност на MATH-500
Кодирање: Надминува 96.3% од учесниците на Codeforces
Општо расудување: 79,8% стапка на поминување на AIME 2024 (SOTA)
Овие резултати позиција DeepSeek R1 меѓу моделите со вештачка интелигенција со најдобри перформанси на глобално ниво.
Распоредување
API: OpenAI-компатибилна крајна точка ($0.14/милион токени)
Отворен код: Тегови лиценцирани од MIT, дестилирани варијанти од 1.5B-70B за комерцијална употреба.
Најдете го во Репозиториум GitHub
Модел екосистем
Варијанти: Основен (R1-Zero), Подобрен (R1), 6 лесни дестилирани модели
Специјализација: Оптимизиран за сложено решавање на проблеми, повеќејазично разбирање и генерирање на кодови од ниво на производство
Патоказ
Континуирани надградби за мултимодална поддршка, подобрување на разговорот и оптимизација на дистрибуирани заклучоци, поттикнати од соработката на заедницата со отворен код.
Отворен код
Првиот во светот чист модел на расудување развиен од RL со имплементација со отворен код 32B лесната верзија постигнува математички перформанси на ниво на GPT-4 на 90% пониска цена
Синџир на мисли визуелизација способност, справување со предизвиците на „црната кутија“ на вештачката интелигенција

Што е DeepSeek R1 онлајн?
DeepSeek R1 претставува револуционерен напредок во вештачката интелигенција, нудејќи врвни перформанси во задачите за расудување, математика и кодирање. Овој иновативен модел покажува способности споредливи со водечките сопственички решенија додека одржува целосна пристапност со отворен код.
Техничка архитектура и способности
Модел архитектура
DeepSeek R1 користи софистицирана архитектура MoE (Мешавина на експерти) со:
- 37B активирани параметри
- 671B вкупни параметри
- Поддршка за должина на контекстот од 128K
Рамката DeepSeek R1 вклучува напредни техники за учење за зајакнување, поставувајќи нови одредници во способностите за расудување со вештачка интелигенција.
Одредници за изведба
DeepSeek R1 постигна извонредни резултати во различни репери:
- MATH-500: 97,3% точност
- AIME 2024: стапка на поминување 79,8%
- Codeforces: 96,3% перцентил рангирање
Овие резултати позиција DeepSeek R1 меѓу моделите со вештачка интелигенција со најдобри перформанси на глобално ниво.


Моделни варијанти и дестилација на Deepseek онлајн
Достапни верзии
DeepSeek R1 доаѓа во повеќе варијанти:
- DeepSeek R1-Zero: Основен модел
- DeepSeek R1: Подобрена верзија
- Повеќе дестилирани верзии кои се движат од 1,5B до 70B параметри
Оптимизација на перформансите
Моделот покажува исклучителни способности во:
Комплексно решавање на проблеми
Математичко расудување
Генерирање кодови
Разбирање на природен јазик
DeepSeek-R1-Distill Models (преземете онлајн)
Модел | Основен модел | Преземи |
---|---|---|
DeepSeek-R1-дестил-Qwen-1,5B | Qwen2.5-Math-1.5B | 🤗 Лице гушкање |
DeepSeek-R1-дестил-Квен-7Б | Qwen2.5-Math-7B | 🤗 Лице гушкање |
DeepSeek-R1-дестил-лама-8B | Лама-3,1-8Б | 🤗 Лице гушкање |
DeepSeek-R1-дестил-Qwen-14B | Qwen2,5-14B | 🤗 Лице гушкање |
DeepSeek-R1-дестил-Qwen-32B | Qwen2,5-32B | 🤗 Лице гушкање |
DeepSeek-R1-дестил-лама-70B | Лама-3.3-70Б-Инструкција | 🤗 Лице гушкање |
можете да најдете повеќе информации за моделите DeepSeek-R1-Distill овде
Цените на Deepseek R1
Детали за цените,
МОДЕЛ(1) | ДОЛЖИНА НА КОНТЕКСТ | МАКС ЖЕТОНИ за креветчето(2) | МАКС ИЗЛЕЗНИ ТОКЕНИ(3) | 1M ЖЕТОНИ ВЛЕЗНА ЦЕНА (КЕШОТ ПОЧИТ) (4) | 1M ЖЕТОНИ ВЛЕЗНА ЦЕНА (ПРОПУШТИ КЕШОТ) | 1M ЖЕТОНИ ИЗЛЕЗНА ЦЕНА |
---|---|---|---|---|---|---|
deepseek-разговор | 64 K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-резонер | 64 K | 32К | 8K | $0.14 | $0.55 | $2.19 (6) |
Споредба на цени: DeepSeek R1 наспроти OpenAI o1
1. Цени DeepSeek R1
DeepSeek R1 нуди висококонкурентна структура на цени, што го прави значително подостапен од OpenAI o1:
- Влезни токени (хит на кешот): $0,14 на милион токени
- Влезни токени (нема кешот): $0,55 на милион токени
- Излезни токени: $2,19 на милион токени
Интелигентниот систем за кеширање ги намалува трошоците за повторени прашања, обезбедувајќи до 90% заштеди за кеш хитови25.
2. Цени за OpenAI o1
Спротивно на тоа, OpenAI o1 е значително поскап:
- Влезни токени: $15 на милион токени
- Излезни токени: $60 на милион токени
Ова го прави OpenAI o1 90-95% поскапо од DeepSeek R1 за еквивалентна употреба112.
3. Ефикасност на трошоците
Цената на DeepSeek R1 е 90-95% пониски отколку OpenAI o1, нудејќи исплатлива алтернатива без да се загрозат перформансите. На пример:
- 1 милион влезни токени:
- DeepSeek R1: 0,14 (cachehit) или 0,14 (вавчдздравот)или0,55 (промашување на кешот)
- OpenAI o1: $15
- 1 милион излезни токени:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Оваа достапност го прави DeepSeek R1 атрактивен избор за програмери и претпријатија1512.
4. Дополнителни придобивки
- Пристап со отворен код: DeepSeek R1 е достапен под лиценца MIT, овозможувајќи бесплатна употреба, модификација и комерцијализација512.
- Флексибилност на API: API-то на DeepSeek R1 поддржува напредни функции како расудување со синџир на мисли и ракување со долг контекст (до 128K токени)212.


Блогови и вести за Deepseek R1 и Deepseek онлајн
-
DeepSeek го објави својот изворен код, детално објаснување за FlashMLA
-
Што е FlashMLA? Сеопфатен водич за неговото влијание врз кернелите за декодирање на вештачката интелигенција
-
Qwen2.5-max vs DeepSeek R1: Длабока споредба на модели: целосна анализа на сценаријата на апликацијата
-
Блиску е до DeepSeek-R1-32B и го скрши s1 на Fei-Fei Li! UC Berkeley и други нови модели на SOTA заклучоци со отворен код
Изберете друг јазик за deepseek R1
Често поставувани прашања за deepseek-r1
1,Што ја прави уникатна архитектурата на DeepSeek-R1?
- DeepSeek R1 користи a Системот на Министерството за економија со 37B активни/671B вкупни параметри и 128K поддршка за контекст, оптимизирана преку чисто учење за засилување без надгледувано фино подесување.
2. Како DeepSeek R1 се споредува со OpenAI o1 во цените?
- DeepSeek R1 трошоци 90-95% помалку: 0,14/милионипуттокениvsOpenAIo1's0,14/милјилјасонинстрuttокдnсvсОпдnАЈасо1′с15, со еквивалентни способности за расудување.
3. Може ли да распоредам DeepSeek R1 локално?
- Да, DeepSeek R1 поддржува локално распоредување преку vLLM/SGLang и нуди 6 дестилирани модели (параметри 1.5B-70B) за средини со ограничени ресурси.
4. Кои одредници ги докажуваат перформансите на DeepSeek R1?
- Постигнува SOTA во MATH-500 (97,3%), Codeforces (96,3% перцентил) и AIME 2024 (79,8%), надминувајќи ги повеќето комерцијални модели.
5. Дали DeepSeek R1 е со отворен код?
- Да, DeepSeek R1 е лиценциран од MIT со целосни тежини на модели достапни на GitHub, дозволувајќи комерцијална употреба и модификација.
6. Кои когнитивни способности го разликуваат DeepSeek R1?
- Карактеристики самопроверка и повеќестепена рефлексија, решавање на сложени проблеми преку видливо расудување со синџир на мисли.
7. Кои индустрии имаат најголема корист од DeepSeek R1?
- Идеален за истражување на вештачка интелигенција, генерирање кодови на претпријатија, математичко моделирање и повеќејазични NLP апликации кои бараат напредно расудување.
8. Како DeepSeek R1 се справува со интеграцијата на API?
- Нуди крајни точки на API компатибилни со OpenAI со 128K поддршка за контекст и интелигентно кеширање ($0.14/милион токени за хитови на кешот).
9. Кои безбедносни мерки ги спроведува DeepSeek R1?
- Вградената контрола на повторување (температура 0,5-0,7) и механизмите за усогласување ги спречуваат бескрајните јамки вообичаени кај моделите обучени со RL.
10. Каде можам да најдам техничка документација за DeepSeek R1?
Пристапете до целосните спецификации преку DeepSeek R1 Техничка хартија и API документи.