DeepSeek / DeepSeek-V3.1

multimodal

DeepSeek-V3.1是一个混合模型,同时支持思考模式和非思考模式。

文本生成MoE架构
0 0 1 更新于 2026-05-18 03:23

概述

DeepSeek-V3.1是一个混合模型,同时支持思考模式和非思考模式。

模型

名称尺寸语境输入
deepseek-v3.1:latest404GB16万文本
deepseek-v3.1:671b404GB16万文本
deepseek-v3.1:671b-cloud16万文本