DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月26日,山东省烟台市中级人民法院一审公开宣判青岛市人大常委会原党组副书记、副主任张锡君受贿一案。 法院以受贿罪判处被告人张锡君死刑,缓期二年执行,剥夺政治权利终身,并处没收个人全部财产,在其死刑缓期执行二年期满依法减为无期徒刑后,终身监禁,不得减刑、假释;扣押在案的张锡君受贿所得...
美股三大指数集体高开,道指涨0.45%,纳指涨0.08%,标普500指数涨0.2%。格芯(GlobalFoundries)涨超11%,此前报道称美国计划出台芯片生产新规以降低对海外依赖。英特尔涨超3%,有报道称其接触台积电寻求投资或合作。波音涨超4%,小鹏汽车、理想汽车涨超2%;金山云跌超8%。...
界面新闻记者 赵阳戈 特种光纤企业武汉长进光子技术股份有限公司(以下简称“长进光子”)提交科创板IPO申请,计划募资额为7.8亿元,引发市场关注。实控人李进延是华中科技大学博士研究生导师,于今年5月正式全职加入公司。 长进光子依托高校资源,在特种光纤领域实现关键技术突破。然而,公...
界面新闻记者 | 周芳颖界面新闻编辑 | 许悦 妮维雅想要靠新品精华向高端美妆的门槛爬一爬。 近期,德国化妆品集团拜尔斯道夫在2025财年第二季度财报会上表示,在中国,该公司采取了大胆举措,重塑妮维雅品牌,使其从价格敏感的个人护理领域转向高端护肤品领域,并通过数字化优先的策略实现增长。这...
记者 辛圆 9月26日,国家发改委等六部门联合印发《关于加强数字经济创新型企业培育的若干措施》(以下简称《措施》),从健全数创企业源头发现机制、强化多维用数保障、强化算力资源供给支撑等多个方面提出一系列具体措施。 《措施》提出,鼓励有条件地区探索发放“数据券”“算法券”,降低治数...
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪 从去年就在寻找新故事的爱奇艺,又看中了线下娱乐业。 在2025爱奇艺iJOY秋季悦享会上,爱奇艺创始人、首席执行官龚宇在演讲中明确,线下业务未来将是爱奇艺的核心...