Skip to Content

Ring

Ring 是蚂蚁集团开源的万亿参数量级思考模型,采用与 Ling 系列同源的 MoE(混合专家)架构,单次推理激活约 63B 参数,面向真实的 Agent 工作流。模型重点优化编码 Agent、工具调用与长周期任务执行,并在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等基准评测中取得领先表现。


为什么选择 Ring?

Ring 面向真实复杂任务场景设计,不只追求“更聪明”,更关注“在合理成本下稳定完成任务”。在编码 Agent、多工具协作、工程开发和科研分析等生产环境中,Ring 能在效果、速度与成本之间提供更优平衡。

面向真实工作流

Ring-2.6-1T 引入可调节的推理强度机制,支持 highxhigh 两种推理强度,并且按照任务复杂度分配 token 用量:在工具密集、多轮交互的 Agent 流水中,更易以较低 token 开销取得更强表现。

  • high:面向高频 Agent 工作流,具备更低 token 开销与更快多步执行能力,适合多轮交互、工具协作、任务拆解和生产级默认调用。
  • xhigh:面向数学、科研、复杂逻辑分析与多路径探索等高难任务,为复杂推理提供更充分的思考空间。

这种分层推理机制让“简单任务不过度思考、复杂任务充分思考”成为可能,更贴合真实生产中的任务差异。

推理效率

Ring 系列继承 Ling MoE 架构的稀疏激活特性,每次推理仅激活少量参数,显著降低计算开销;同时引入了线性注意力机制,使得内存访问开销相比之前降低 10 倍,吞吐量提升 3 倍,适用于深度推理和长程任务。

长上下文支持

Ring-2.6-1T 支持 256K 上下文窗口,满足长文档分析、多步复杂推理等场景需求。

  • 单次可处理约 20 万字的长文本输入。
  • 超长推理链条下保持逻辑一致性,无明显性能衰减。
  • 支持大规模代码库的整体理解与生成。

典型应用场景:数学竞赛解题、代码审查与生成、学术论文分析、复杂逻辑推理。


模型详解

Ring-2.6-1T

Ring-2.6-1T 为万亿参数量级的思考模型,单次推理激活约 63B 参数,面向 Agent 工作流:侧重 Agent、工具调用与长周期任务执行,在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等基准上取得领先表现。模型同时兼顾执行质量、延迟与成本,适合进阶编码 Agent、复杂推理流水线及大规模自治系统。

技术特性

  • 规模与效率:万亿参数规模 MoE,63B 激活参数,在强能力与推理开销之间取得平衡。
  • 自适应推理预算high / xhigh 两档推理强度,按任务复杂度动态分配推理资源;在工具密集、多轮交互场景中更易以较低 token 开销获得更强效果。
  • high 模式(生产默认):面向高频 Agent 与长程执行,Token 开销更低、多步更快,适配多轮交互、工具协作与任务拆解。
  • xhigh 模式(高难任务):面向数学、科研、复杂逻辑分析与多路径探索,提供更充分的思考深度。
  • 真实任务与评测:在 PinchBench、ClawEval、TAU2-Bench、GAIA2-search 等侧重真实执行与工具协作的评测中表现突出;在 ARC-AGI-V2、AIME 26、GPQA Diamond 等高难推理评测中展现更高能力上限。

典型应用场景

  • 进阶编码 Agent、编程助手与代码仓库级任务
  • 工具编排、多轮协作与长周期自主执行
  • 复杂推理流水线与企业级工作流
  • 大规模自治系统中需权衡质量、时延与成本的场景
  • 高难数学与科研分析、多路径推理与复杂决策

演进历程

时间里程碑技术意义
2025.09开源业内首个万亿参数推理大模型(Ring-1T)实现最大规模开源 FP8 端到端训练,验证 MoE 架构在推理任务中的可行性
2026.01发布 Ring 2.5 系列引入 Hybrid Linear Attention 架构,支持 128K 上下文,推理效率与深度显著提升
2026.05发布 Ring-2.6-1T(万亿级旗舰思考模型)引入推理强度与自适应推理预算,强化编码 Agent、工具协作与长周期执行,真实任务与高难推理能力全面提升

版本演进脉络

  1. Ring 1.0 —— 验证 MoE 架构在万亿参数规模推理模型训练中的可行性。
  2. Ring 2.0 —— 引入 FP8 全精度训练,大幅提升训练速度并降低显存开销。
  3. Ring 2.5 —— 引入 Hybrid Linear Attention,突破长上下文推理瓶颈,具备端到端 Agentic 任务执行能力。
  4. Ring 2.6 —— 引入可调节推理强度与自适应推理预算,面向真实 Agent 工作流优化编码、工具调用与长程任务执行。

技术生态

基于 Ring 推理基座,进一步构建了完整的上下游技术生态:

  • 高性能算子库:开源的高性能训练与推理算子系统,覆盖从训练到部署的全链路。
  • 垂直领域模型:面向医疗、金融等行业的专用推理模型,在专业任务场景下性能更优。
  • 开源社区:全部研究成果开源至 Inclusion AI  社区。

快速开始

  1. 获取 API 密钥:获取访问凭证。
  2. 完成首次调用:5 分钟完成第一个 API 请求。
  3. 控制推理强度:按任务复杂度动态调节 Ring-2.6-1T 的推理深度,在质量与 Token 效率之间灵活权衡。
  4. 探索更多能力:深入了解流式输出、长上下文等高级特性。
这个页面对你有帮助吗?
Last updated on