↑

granite4.1

granite4.1Granite 4

0 0 2 更新于 2026-05-06 22:03

Granite 4.1 语言模型是一系列最先进的开源基础模型，采用纯解码器架构，提供三种尺寸：3B、8B 和 30B。它们原生支持多语言能力、广泛的编码任务、检索增强生成（RAG）、工具使用以及结构化 JSON 输出。

我们的模型从头开始训练，使用了约 15 万亿个 token，采用五阶段策略，旨在逐步优化数据质量和模型能力。前两个阶段涵盖预训练本身，随后在第三和第四阶段过渡到使用高质量数据退火的中期训练。第五个也是最后一个阶段执行长上下文扩展，通过分阶段过程将上下文窗口扩展到 512K 个 token。

所有模型均根据 Apache 2.0 许可证公开发布，允许免费用于研究和商业目的。数据整理和训练过程专门针对企业场景和定制化设计，结合了治理、风险和合规（GRC）评估以及 IBM 的标准数据清理和文档质量审查流程。

我们提供基础模型（预训练后的检查点）和指令模型（针对对话、指令遵循、有用性和安全性进行微调的检查点）。

请注意：instruct 模型名称中不包含 base 限定符（例如，ibm-granite/granite4.1:8b 与 ibm-granite/granite4.1:8b-base）。

运行默认模型（即通常为 Q4_K_M 量化版本）的示例：


1
ollama run ibm/granite4.1:8b

运行其他量化版本（例如 Q8_0）：


1
ollama run ibm/granite4.1:8b-q8_0

支持的语言：英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。用户可针对这些语言之外的语言对 Granite 4.1 模型进行微调。

该模型旨在处理通用的指令遵循任务，并可集成到跨多个领域（包括商业应用）的 AI 助手中。

该模型旨在响应通用指令，可用于构建面向多个领域（包括商业应用）的 AI 助手。