ChatGPT / gpt-oss
文本生成深度思考逻辑推理MoE架构
text
暂无简介
0 0 0 更新于 2025-09-16
DeepSeek / DeepSeek-V3.1
文本生成MoE架构
multimodal
## 概述 DeepSeek-V3.1是一个混合模型,同时支持思考模式和非思考模式。 ## 模型 | 名称 | 尺寸 | 语境 | 输入 | |-----------------------------|--------|-------|------| | deepseek-v3.1:latest | 404GB | 16万 | 文本 | | deepseek-v3.1:671b | 404GB | 16万 | 文本 | | deepseek-v3.1:671b-cloud | — | 16万 | 文本 |
0 0 1 更新于 2025-09-15