Ring
Ring 是蚂蚁集团开源的万亿参数量级思考模型,采用与 Ling 系列同源的 MoE(混合专家)架构,单次推理激活约 63B 参数,面向真实的 Agent 工作流。模型重点优化编码 Agent、工具调用与长周期任务执行,并在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等基准评测中取得领先表现。
为什么选择 Ring?
Ring 面向真实复杂任务场景设计,不只追求“更聪明”,更关注“在合理成本下稳定完成任务”。在编码 Agent、多工具协作、工程开发和科研分析等生产环境中,Ring 能在效果、速度与成本之间提供更优平衡。
面向真实工作流
Ring-2.6-1T 引入可调节的推理强度机制,支持 high 与 xhigh 两种推理强度,并且按照任务复杂度分配 token 用量:在工具密集、多轮交互的 Agent 流水中,更易以较低 token 开销取得更强表现。
- high:面向高频 Agent 工作流,具备更低 token 开销与更快多步执行能力,适合多轮交互、工具协作、任务拆解和生产级默认调用。
- xhigh:面向数学、科研、复杂逻辑分析与多路径探索等高难任务,为复杂推理提供更充分的思考空间。
这种分层推理机制让“简单任务不过度思考、复杂任务充分思考”成为可能,更贴合真实生产中的任务差异。
推理效率
Ring 系列继承 Ling MoE 架构的稀疏激活特性,每次推理仅激活少量参数,显著降低计算开销;同时引入了线性注意力机制,使得内存访问开销相比之前降低 10 倍,吞吐量提升 3 倍,适用于深度推理和长程任务。
长上下文支持
Ring-2.6-1T 支持 256K 上下文窗口,满足长文档分析、多步复杂推理等场景需求。
- 单次可处理约 20 万字的长文本输入。
- 超长推理链条下保持逻辑一致性,无明显性能衰减。
- 支持大规模代码库的整体理解与生成。
典型应用场景:数学竞赛解题、代码审查与生成、学术论文分析、复杂逻辑推理。
模型详解
Ring-2.6-1T
Ring-2.6-1T 为万亿参数量级的思考模型,单次推理激活约 63B 参数,面向 Agent 工作流:侧重 Agent、工具调用与长周期任务执行,在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等基准上取得领先表现。模型同时兼顾执行质量、延迟与成本,适合进阶编码 Agent、复杂推理流水线及大规模自治系统。
技术特性:
- 规模与效率:万亿参数规模 MoE,63B 激活参数,在强能力与推理开销之间取得平衡。
- 自适应推理预算:
high/xhigh两档推理强度,按任务复杂度动态分配推理资源;在工具密集、多轮交互场景中更易以较低 token 开销获得更强效果。 - high 模式(生产默认):面向高频 Agent 与长程执行,Token 开销更低、多步更快,适配多轮交互、工具协作与任务拆解。
- xhigh 模式(高难任务):面向数学、科研、复杂逻辑分析与多路径探索,提供更充分的思考深度。
- 真实任务与评测:在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等侧重真实执行与工具协作的评测中表现突出;在 ARC-AGI-V2、AIME 26、GPQA Diamond 等高难推理评测中展现更高能力上限。
典型应用场景:
- 进阶编码 Agent、编程助手与代码仓库级任务
- 工具编排、多轮协作与长周期自主执行
- 复杂推理流水线与企业级工作流
- 大规模自治系统中需权衡质量、时延与成本的场景
- 高难数学与科研分析、多路径推理与复杂决策
演进历程
| 时间 | 里程碑 | 技术意义 |
|---|---|---|
| 2025.09 | 开源业内首个万亿参数推理大模型(Ring-1T) | 实现最大规模开源 FP8 端到端训练,验证 MoE 架构在推理任务中的可行性 |
| 2026.01 | 发布 Ring 2.5 系列 | 引入 Hybrid Linear Attention 架构,支持 128K 上下文,推理效率与深度显著提升 |
| 2026.05 | 发布 Ring-2.6-1T(万亿级旗舰思考模型) | 引入推理强度与自适应推理预算,强化编码 Agent、工具协作与长周期执行,真实任务与高难推理能力全面提升 |
版本演进脉络:
- Ring 1.0 —— 验证 MoE 架构在万亿参数规模推理模型训练中的可行性。
- Ring 2.0 —— 引入 FP8 全精度训练,大幅提升训练速度并降低显存开销。
- Ring 2.5 —— 引入 Hybrid Linear Attention,突破长上下文推理瓶颈,具备端到端 Agentic 任务执行能力。
- Ring 2.6 —— 引入可调节推理强度与自适应推理预算,面向真实 Agent 工作流优化编码、工具调用与长程任务执行。
技术生态
基于 Ring 推理基座,进一步构建了完整的上下游技术生态:
- 高性能算子库:开源的高性能训练与推理算子系统,覆盖从训练到部署的全链路。
- 垂直领域模型:面向医疗、金融等行业的专用推理模型,在专业任务场景下性能更优。
- 开源社区:全部研究成果开源至 Inclusion AI 社区。
快速开始
- 获取 API 密钥:获取访问凭证。
- 完成首次调用:5 分钟完成第一个 API 请求。
- 控制推理强度:按任务复杂度动态调节 Ring-2.6-1T 的推理深度,在质量与 Token 效率之间灵活权衡。
- 探索更多能力:深入了解流式输出、长上下文等高级特性。