DeepSeek R1 онлајн (бесплатно|нологин)

Револуционерен модел на вештачка интелигенција со отворен извор за напредно расудување што го надминува Openai o1

DeepSeek R1 Разговор онлајн бесплатно

DeepSeek R1 WEBGPU онлајн

Агент за кодирање со вештачка интелигенција Powered BY DeepSeek онлајн бесплатно сега!

Функција спакувана од DeepSeek R1 онлајн

Архитектура

Вграден на МЕ (Мешавина на експерти) со 37B активни/671B вкупни параметри и 128K должина на контекстот. Спроведува напредно учење за зајакнување за да постигне самопроверка, размислување во повеќе чекори и способности за расудување усогласено со човекот.

Изведба

Математика: 97,3% точност на MATH-500
Кодирање: Надминува 96.3% од учесниците на Codeforces
Општо расудување: 79,8% стапка на поминување на AIME 2024 (SOTA)
Овие резултати позиција DeepSeek R1 меѓу моделите со вештачка интелигенција со најдобри перформанси на глобално ниво.

Распоредување

API: OpenAI-компатибилна крајна точка ($0.14/милион токени)
Отворен код: Тегови лиценцирани од MIT, дестилирани варијанти од 1.5B-70B за комерцијална употреба.
Најдете го во Репозиториум GitHub

Модел екосистем

Варијанти: Основен (R1-Zero), Подобрен (R1), 6 лесни дестилирани модели
Специјализација: Оптимизиран за сложено решавање на проблеми, повеќејазично разбирање и генерирање на кодови од ниво на производство

Патоказ

Континуирани надградби за мултимодална поддршка, подобрување на разговорот и оптимизација на дистрибуирани заклучоци, поттикнати од соработката на заедницата со отворен код.

Отворен код

Првиот во светот чист модел на расудување развиен од RL со имплементација со отворен код 32B лесната верзија постигнува математички перформанси на ниво на GPT-4 на 90% пониска цена
Синџир на мисли визуелизација способност, справување со предизвиците на „црната кутија“ на вештачката интелигенција

Што е DeepSeek R1 онлајн?

DeepSeek R1 претставува револуционерен напредок во вештачката интелигенција, нудејќи врвни перформанси во задачите за расудување, математика и кодирање. Овој иновативен модел покажува способности споредливи со водечките сопственички решенија додека одржува целосна пристапност со отворен код.

Техничка архитектура и способности

Модел архитектура

DeepSeek R1 користи софистицирана архитектура MoE (Мешавина на експерти) со:

  • 37B активирани параметри
  • 671B вкупни параметри
  • Поддршка за должина на контекстот од 128K

Рамката DeepSeek R1 вклучува напредни техники за учење за зајакнување, поставувајќи нови одредници во способностите за расудување со вештачка интелигенција.

Одредници за изведба

DeepSeek R1 постигна извонредни резултати во различни репери:

  • MATH-500: 97,3% точност
  • AIME 2024: стапка на поминување 79,8%
  • Codeforces: 96,3% перцентил рангирање

Овие резултати позиција DeepSeek R1 меѓу моделите со вештачка интелигенција со најдобри перформанси на глобално ниво.

Моделни варијанти и дестилација на Deepseek онлајн

Достапни верзии

DeepSeek R1 доаѓа во повеќе варијанти:

  • DeepSeek R1-Zero: Основен модел
  • DeepSeek R1: Подобрена верзија
  • Повеќе дестилирани верзии кои се движат од 1,5B до 70B параметри

Оптимизација на перформансите

Моделот покажува исклучителни способности во:

Комплексно решавање на проблеми

Математичко расудување

Генерирање кодови

Разбирање на природен јазик

DeepSeek-R1-Distill Models (преземете онлајн)

МоделОсновен моделПреземи
DeepSeek-R1-дестил-Qwen-1,5BQwen2.5-Math-1.5B🤗 Лице гушкање
DeepSeek-R1-дестил-Квен-7БQwen2.5-Math-7B🤗 Лице гушкање
DeepSeek-R1-дестил-лама-8BЛама-3,1-8Б🤗 Лице гушкање
DeepSeek-R1-дестил-Qwen-14BQwen2,5-14B🤗 Лице гушкање
DeepSeek-R1-дестил-Qwen-32BQwen2,5-32B🤗 Лице гушкање
DeepSeek-R1-дестил-лама-70BЛама-3.3-70Б-Инструкција🤗 Лице гушкање

можете да најдете повеќе информации за моделите DeepSeek-R1-Distill овде

Deepseek R1 онлајн е. Неверојатно!!

R1 користи чисто учење за зајакнување за да одговара на OpenAI o1 - со 95% помалку трошоци. , неверојатно е
Џими Смит

Цените на Deepseek R1

Детали за цените,

МОДЕЛ(1)ДОЛЖИНА НА КОНТЕКСТМАКС ЖЕТОНИ за креветчето(2)МАКС ИЗЛЕЗНИ ТОКЕНИ(3)1M ЖЕТОНИ
ВЛЕЗНА ЦЕНА
(КЕШОТ ПОЧИТ) (4)
1M ЖЕТОНИ
ВЛЕЗНА ЦЕНА
(ПРОПУШТИ КЕШОТ)
1M ЖЕТОНИ
ИЗЛЕЗНА ЦЕНА
deepseek-разговор64 K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-резонер64 K32К8K$0.14$0.55$2.19 (6)

Споредба на цени: DeepSeek R1 наспроти OpenAI o1

1. Цени DeepSeek R1

DeepSeek R1 нуди висококонкурентна структура на цени, што го прави значително подостапен од OpenAI o1:

  • Влезни токени (хит на кешот): $0,14 на милион токени
  • Влезни токени (нема кешот): $0,55 на милион токени
  • Излезни токени: $2,19 на милион токени

Интелигентниот систем за кеширање ги намалува трошоците за повторени прашања, обезбедувајќи до 90% заштеди за кеш хитови25.

2. Цени за OpenAI o1

Спротивно на тоа, OpenAI o1 е значително поскап:

  • Влезни токени: $15 на милион токени
  • Излезни токени: $60 на милион токени

Ова го прави OpenAI o1 90-95% поскапо од DeepSeek R1 за еквивалентна употреба112.

3. Ефикасност на трошоците

Цената на DeepSeek R1 е 90-95% пониски отколку OpenAI o1, нудејќи исплатлива алтернатива без да се загрозат перформансите. На пример:

  • 1 милион влезни токени:
    • DeepSeek R1: 0,14 (cachehit) или 0,14 (вавчдздравот)или0,55 (промашување на кешот)
    • OpenAI o1: $15
  • 1 милион излезни токени:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Оваа достапност го прави DeepSeek R1 атрактивен избор за програмери и претпријатија1512.

4. Дополнителни придобивки

  • Пристап со отворен код: DeepSeek R1 е достапен под лиценца MIT, овозможувајќи бесплатна употреба, модификација и комерцијализација512.
  • Флексибилност на API: API-то на DeepSeek R1 поддржува напредни функции како расудување со синџир на мисли и ракување со долг контекст (до 128K токени)212.

Блогови и вести за Deepseek R1 и Deepseek онлајн

  • DeepSeek го објави својот изворен код, детално објаснување за FlashMLA

  • Што е FlashMLA? Сеопфатен водич за неговото влијание врз кернелите за декодирање на вештачката интелигенција

  • Qwen2.5-max vs DeepSeek R1: Длабока споредба на модели: целосна анализа на сценаријата на апликацијата

  • Блиску е до DeepSeek-R1-32B и го скрши s1 на Fei-Fei Li! UC Berkeley и други нови модели на SOTA заклучоци со отворен код

Изберете друг јазик за deepseek R1

Често поставувани прашања за deepseek-r1

1,Што ја прави уникатна архитектурата на DeepSeek-R1?

  • DeepSeek R1 користи a Системот на Министерството за економија со 37B активни/671B вкупни параметри и 128K поддршка за контекст, оптимизирана преку чисто учење за засилување без надгледувано фино подесување.

2. Како DeepSeek R1 се споредува со OpenAI o1 во цените?

  • DeepSeek R1 трошоци 90-95% помалку: 0,14/милионипуттокениvsOpenAIo1's0,14/милјилјасонинстрuttокдnсvсОпдnАЈасо1′с15, со еквивалентни способности за расудување.

3. Може ли да распоредам DeepSeek R1 локално?

  • Да, DeepSeek R1 поддржува локално распоредување преку vLLM/SGLang и нуди 6 дестилирани модели (параметри 1.5B-70B) за средини со ограничени ресурси.

4. Кои одредници ги докажуваат перформансите на DeepSeek R1?

  • Постигнува SOTA во MATH-500 (97,3%), Codeforces (96,3% перцентил) и AIME 2024 (79,8%), надминувајќи ги повеќето комерцијални модели.

5. Дали DeepSeek R1 е со отворен код?

  • Да, DeepSeek R1 е лиценциран од MIT со целосни тежини на модели достапни на GitHub, дозволувајќи комерцијална употреба и модификација.

6. Кои когнитивни способности го разликуваат DeepSeek R1?

  • Карактеристики самопроверка и повеќестепена рефлексија, решавање на сложени проблеми преку видливо расудување со синџир на мисли.

7. Кои индустрии имаат најголема корист од DeepSeek R1?

  • Идеален за истражување на вештачка интелигенција, генерирање кодови на претпријатија, математичко моделирање и повеќејазични NLP апликации кои бараат напредно расудување.

8. Како DeepSeek R1 се справува со интеграцијата на API?

  • Нуди крајни точки на API компатибилни со OpenAI со 128K поддршка за контекст и интелигентно кеширање ($0.14/милион токени за хитови на кешот).

9. Кои безбедносни мерки ги спроведува DeepSeek R1?

  • Вградената контрола на повторување (температура 0,5-0,7) и механизмите за усогласување ги спречуваат бескрајните јамки вообичаени кај моделите обучени со RL.

10. Каде можам да најдам техничка документација за DeepSeek R1?

Пристапете до целосните спецификации преку DeepSeek R1 Техничка хартија и API документи.