新闻
你的位置:开云(中国)Kaiyun·官方网站 登录入口 > 新闻 >
开云(中国)Kaiyun·官方网站 - 登录入口该架构灵验处分了MoE推理时高额的访存问题-开云(中国)Kaiyun·官方网站 登录入口
发布日期:2026-04-09 11:41 点击次数:87

转自:证券时报开云(中国)Kaiyun·官方网站 - 登录入口
证券时报e公司讯,跟着模子界限的扩大,推理老本和访存恶果已成为放胆大模子界限运用的枢纽瓶颈。近期,字节跨越豆包大模子团队建议了全新的稀零模子架构UltraMem,该架构灵验处分了MoE推理时高额的访存问题,推理速率较MoE架构耕种2—6倍,推理老本最高可镌汰83%。该照拂还揭示了新架构的Scaling Law,讲明其不仅具备优异的Scaling特点,更在性能上特出了MoE。施行落幕标明,覆按界限达2000万value的UltraMem模子,在同等打算资源下,可同期竣劳动界最初的推理速率和模子性能,为构建数十亿界限value或expert开采了新旅途。
海量资讯、精确解读,尽在新浪财经APP
连累裁剪:张靖笛 开云(中国)Kaiyun·官方网站 - 登录入口
