首页 > 要闻 > 正文

豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%

每日经济新闻

2025年02月12日 14:45

每经北京2月11日电（记者杨昕怡）豆包大模型团队今日宣布，团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家模型）推理时高额的访存问题，推理速度较MoE架构提升2~6倍，推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law（规模定律），证明其不仅具备优异的Scaling特性，更在性能上超越了MoE。

责编杨夏

每经头条

Cover

数亿元假账竟被“开绿灯”！财政部针对隐匿关键审计工作底稿、拒绝配合调查作出顶格处罚

白银50天涨逾80%，疯狂程度远超黄金，历史上爆炒白银往往预示贵金属牛市已到高潮，这次有何不同？

海利生物增值9倍并购的企业，估值八个月即“腰斩”，其第一大客户竟是尚未成立的公司，离奇的事还不少……

AI领航，万象新生：2025中国十大科技进展革新发展纪元

每经热评

专题精选

专题丨国家发改委：要实施更加积极的财政政策和适度宽松的货币政策把促进物价回升作为货币政策的重要考量

专题丨解读2025中国经济年报 | 这份经济成绩单有多不平凡？答案藏在三组数据中

专题丨突发：“清仓美国”！欧美股市大跌！丹麦首相：主权不谈判，准备贸易战！格陵兰岛总理发声

专题丨伊朗总统称攻击最高领袖致全面战争

Copyright© 2014 成都每日经济新闻社有限公司版权所有，未经许可不得转载使用，违者必究

互联网新闻信息服务许可证：51120190017

网站备案号：蜀ICP备19004508号-2

川公网安备 51019002002025号