granite4.1

granite4.1Granite 4
0 0 1 更新于 2026-05-06 22:03

Granite 4 模型

Granite 4.1 语言模型是一系列最先进的开源基础模型,采用纯解码器架构,提供三种尺寸:3B、8B 和 30B。它们原生支持多语言能力、广泛的编码任务、检索增强生成(RAG)、工具使用以及结构化 JSON 输出。

我们的模型从头开始训练,使用了约 15 万亿个 token,采用五阶段策略,旨在逐步优化数据质量和模型能力。前两个阶段涵盖预训练本身,随后在第三和第四阶段过渡到使用高质量数据退火的中期训练。第五个也是最后一个阶段执行长上下文扩展,通过分阶段过程将上下文窗口扩展到 512K 个 token。

所有模型均根据 Apache 2.0 许可证公开发布,允许免费用于研究和商业目的。数据整理和训练过程专门针对企业场景和定制化设计,结合了治理、风险和合规(GRC)评估以及 IBM 的标准数据清理和文档质量审查流程。

我们提供基础模型(预训练后的检查点)和指令模型(针对对话、指令遵循、有用性和安全性进行微调的检查点)。

  • 请注意:instruct 模型名称中不包含 base 限定符(例如,ibm-granite/granite4.1:8bibm-granite/granite4.1:8b-base)。

运行

运行默认模型(即通常为 Q4_K_M 量化版本)的示例:

ollama run ibm/granite4.1:8b

运行其他量化版本(例如 Q8_0):

ollama run ibm/granite4.1:8b-q8_0

支持的语言

支持的语言:英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。用户可针对这些语言之外的语言对 Granite 4.1 模型进行微调。

预期用途

该模型旨在处理通用的指令遵循任务,并可集成到跨多个领域(包括商业应用)的 AI 助手中。

该模型旨在响应通用指令,可用于构建面向多个领域(包括商业应用)的 AI 助手。

能力

  • 摘要
  • 文本分类
  • 文本提取
  • 问答
  • 检索增强生成(RAG)
  • 代码相关任务
  • 函数调用任务
  • 多语言对话用例
  • 中间填充(FIM)代码补全

了解更多