蚂蚁百灵大模型团队近日正式开源了高效推理模型Ring-mini-sparse-2.0-exp,该模型基于全新设计的Ling2.0架构,专为长序列解码任务优化,创新性地结合了高稀疏度的MixtureofExpert(MoE)结构与稀疏注意力机制。据团队介绍,通过架构与推理系统的深度协同优化,该模型在处理复杂长序列推理任务时,吞吐量相较原始版本Ring-mini-2.0提升近3倍。同时,在多个高难度推理基准测试中持续保持领先水平(SOTA),为开源社区提供了一种兼具高性能推理效率和强大上...
蚂蚁百灵大模型团队近日正式开源了高效推理模型 ring-mini-sparse-2.0-exp,该模型基于全新设计的 ling 2.0 架构,专为长序列解码任务优化,创新性地结合了高稀疏度的 mixt
ure of expert(moe)结构与稀疏注意力机制。
据团队介绍,通过架构与推理系统的深度协同优化,该模型在处理复杂长序列推理任务时,吞吐量相较原始版本 Ring-mini-2.0 提升近 3 倍。同时,在多个高难度推理基准测试中持续保持领先水平(SOTA),为开源社区提供了一种兼具高性能推理效率和强大上下文理解能力的轻量级解决方案。
Ling 2.0 Sparse 架构的提出,旨在应对大语言模型发展的两大关键趋势:上下文长度扩展(Context Length Scaling)与测试时扩展(Test Time Scaling)。该机制通过高效的稀疏注意力设计,显著提升了模型在长文本场景下的运行效率。
该方案借鉴了 Mixture of Block Attention (MoBA) 的思想,采用块级稀疏注意力(block-wise sparse attention),将输入的 Key 和 Value 按照块进行划分。每个 query 在 head 维度上仅选择 top-k 个关键块参与注意力计算,大幅降低整体计算量。此外,该设计进一步融合了 Grouped Query Attention (GQA),使同一组内的多个 query heads 共享相同的 top-k 块选择结果,从而实现一次块读取服务多个 head,有效减少内存访问开销(I/O cost)。
Ring-mini-sparse-2.0-exp 开源地址:
Hugging Face:https://www./link/a082c0a47eb5379353243b15bf77c560
ModelScope:https://www./link/f3a3d61b07332233ac57e4f232725e18
GitHub:https://www./link/3310199d4a42bc84d71ce62d2d260379
相关推荐:
AI在线生成文章颠覆内容创作的智能革命,延时ai
ChatGPT坏了用什么?替代方案,满足你的智能对话需求,自我学习的期货ai软件
创作新天地:生成文字的工具与平台,ai286390826
app软件开发公司:开发好app产品的几点注意事项
未来智能:AI智能人工软件引领数字化变革
SEO与SEM:数字营销的核心利器,ai形状工具编辑节点
SEO抢权:如何在竞争激烈的市场中占得先机,正规网站建设口碑好
免费分享一个付费才能学到的推广赚钱项目
SEO|视频|页面优化技巧:提升搜索引擎排名的秘密武器,ai制作书籍排版尺寸
SEOSpider:全面提升网站排名的利器
ChatGPT回答问题,网页无法线下滚动?解决方案轻松get!,wu.ai.ni
怎么看文章是不是AI生成的?揭秘背后的玄机与技巧
ChatGPT中国镜像畅享智能对话的新时代,在线寻找ai
走进“ChatGPT国内平替”国产AI聊天机器人新革命,剪映ai语音引擎提取
2025百度收录优化:提升网站排名,助力企业数字化转型,ai家居的计价方式
SEO优化程序:提升网站流量与排名的关键利器
Chatget免费网站版无需登录,畅享无限对话体验!,iphonex ai
AI写作生成的文章会不会一样?揭秘人工智能内容创作的独特性与未来趋势
AI写文章在线生成器,让创作更轻松
SEO反链:提升网站排名的秘密武器,可爱ai
360快速排名优,助力网站流量突破新高
文章去AI回归创作的本真之美
SEO客服:如何提升客户体验与业务转化的双赢策略,鄂州网站建设公司教程
用AI写一篇文章,如何提升你的写作效率与创意
Bing无法使用怎么办?解决方法及替代方案推荐!,百度ai图像分割文档
未来科技:AI工具为生活赋能,打造智能未来
ChatGPT出现错误503?你需要知道的解决方案和应对策略,学校创意劳动ai发布会
AI写作智能生成:让文字创作进入全新时代
2024年SEO指南:提升网站排名的全方位策略
AI写文章关键词:智能写作的未来与应用