DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
记者 | 周姝祺编辑 | 赵柏源 汽车公司信奉了数十年的精益生产模式似乎到了必须要重塑的危急关头。 过去两年,一颗成本5元不到的芯片成了汽车公司老板们高价求购都得不到的“期货”;一个随处可见的线束成为制约汽车生产下线的“绳索”。越来越多的人意识到,保住供应链才能保住企业的生命线。...
界面新闻记者 赵阳戈 特种光纤企业武汉长进光子技术股份有限公司(以下简称“长进光子”)提交科创板IPO申请,计划募资额为7.8亿元,引发市场关注。实控人李进延是华中科技大学博士研究生导师,于今年5月正式全职加入公司。 长进光子依托高校资源,在特种光纤领域实现关键技术突破。然而,公...
界面新闻记者 | 陈慧东 光电玻璃精加工企业沃格光电(603773.SH)日前修改了其定增融资计划。 沃格光电拟定增募资不超过15亿元,拟用于玻璃基Mini LED显示背光模组项目和补充流动资金及偿还银行贷款项目。 界面新闻记者注意到,对比沃格光电今年5月披露的原定增预案,此次公司...
据Wind数据统计,今年内*ST宇顺涨停天数达62天,年初至今涨幅已超1060%。同期,已有9家ST公司涨幅超100%,覆盖计算机、机械设备、电子等多个行业。从行业来看,上述9家公司来自计算机、电子、机械设备、传媒、轻工制造等多个行业。其中,ST迪威迅、ST证通、ST易联众三家公司均来自计算机行业。...
界面新闻记者 | 朱咏玲界面新闻编辑 | 楼婍沁 香水集团颖通控股在上市后着力发展自有渠道品牌。 该公司近日在香港发布《2025港澳香氛市场发展趋势白皮书》,该白皮书的核心结论是,如今香氛产业正从“感官愉悦”向“情绪健康核心需求”转型。 颖通控股由此表示,为把握住“情绪健康”的市场...