百度发布最新交通出行模型DeepSeek-V3.2 Exp并宣布开源
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻编辑 | 江怡曼 9月26日,港股上市公司地平线机器人(09660.HK)股价大跌,截至当天收盘,报9.7港元/股,股价下跌了8.49%。 当天,公司在港交所公告,公司拟以每股9.99港元(折价约5.75%)配售股份,筹资净额约63.39亿港元。配售股份占公司现有已发行股本约4....
界面新闻记者 | 赵晓娟界面新闻编辑 | 牙韩翔 葛优的身影出现在三元鲜奶的广告片中,并喊出“喝了几十年,还是认三元”这个19年前的广告语,他勾起许多北京消费者关于三元牛奶的记忆碎片——这是三元股份时隔19年再度为鲜奶产品启用代言人葛优,并借此正式推出了“三元北京鲜牛奶”。这是一款升级版的72...
9月25日晚,奥维通信股份有限公司(以下简称“ST奥维”,002231.SZ)公告称,公司通过中国执行信息公开网查询到,公司控股股东、实际控制人的一致行动人上海东和欣新材料集团有限公司被上海市松江区人民法院列为失信被执行人。截至2025年6月30日,上海东和欣及其关联方仍有1.86亿元资金占用款尚未...
界面新闻记者 | 蔡星卓界面新闻编辑 | 刘海川 斥巨资购买的那栋电商楼还在,“东北雨姐”不见了。 人们说,这栋楼花了她一千多万元。她的身边人告诉界面新闻,这幢大楼实际花了她约1800万元,“贷了1200多万,要还到2027年”。 “红薯粉条”售假事件后,这里昼夜寂静。虽然关键的名...
记者 王珍 全国统一大市场建设迎来重要进展。9月11日,国务院关于全国部分地区要素市场化配置综合改革试点实施方案的批复显示,自即日起2年内,在北京城市副中心、江苏苏南重点城市、浙江杭甬温等10个地区开展要素市场化配置综合改革试点。 改革开放以来,我国绝大部分商品和服务都已实现了市...
【台湾】台风致花莲堰塞湖溢流,已有15人遇难31人失联 据央视新闻客户端消息,台风“桦加沙”外围环流导致台湾省出现强降雨,9月23日,暴雨造成花莲马太鞍溪堰塞湖溢流,洪水冲进居民区,造成人员伤亡。截至9月25日上午10时,当地救援部门通报新增1人死亡,累计15人死亡、31人失联。记者探访了台湾...