DeepSeek / DeepSeek-R1

text

文本生成逻辑推理
0 0 1 更新于 2025-09-23 01:20

概述

DeepSeek-R1 杭州深度求索公司开发的一个开放推理模型,该模型在数学、编程和通用逻辑等多项基准测试中均展现出优异的性能,其性能接近 O3 和 Gemini 2.5 Pro 等领先模型。DeepSeek-R1 已进行小版本升级,升级至 DeepSeek-R1-0528,包含 80 亿参数精简模型和 6710 亿参数完整模型。

模型

名称尺寸语境输入Ollama 下载命令
deepseek-r1:latest5.2GB128千文本ollama run deepseek-r1
deepseek-r1:1.5b1.1GB128千文本ollama run deepseek-r1:1.5b
deepseek-r1:7b4.7GB128千文本ollama run deepseek-r1:7b
deepseek-r1:8b5.2GB128千文本ollama run deepseek-r1:8b
deepseek-r1:14b9.0GB128千文本ollama run deepseek-r1:14b
deepseek-r1:32b20GB128千文本ollama run deepseek-r1:32b
deepseek-r1:70b43GB128千文本ollama run deepseek-r1:70b
deepseek-r1:671b404GB16万文本ollama run deepseek-r1:671b

自述文件

将较大模型的推理模式提炼到较小的模型中,与通过 RL 在小模型上发现的推理模式相比,可以获得更好的性能。

以下是使用 DeepSeek-R1 生成的推理数据,针对研究界广泛使用的几种密集模型进行微调后创建的模型。评估结果表明,经过提炼的较小密集模型在基准测试中表现出色。 image

License

模型权重遵循 MIT 许可证。DeepSeek-R1 系列支持商业使用,允许进行任何修改和衍生工作,包括但不限于用于训练其他 LLM 模型的蒸馏。请注意:

Qwen 精炼模型源自 Qwen-2.5 系列,该系列最初获得 Apache 2.0 许可,现在使用 DeepSeek-R1 精选的 800k 个样本进行了微调。

Llama 8B 精简模型源自 Llama3.1-8B-Base,最初根据 llama3.1 许可证获得许可。

Llama 70B 精简模型源自 Llama3.3-70B-Instruct,最初根据 llama3.3 许可证获得授权。