中金发表报告指,近期DeepSeek发布了其新一代开源模型V4系列并公布技术报告,作为国产开源模型的代表厂商,DeepSeek的技术创新也是模型产业进步的方向之一。此次,V4系列最核心架构创新在於
应用混合注意力机制降低单Token推理FLOPs和KV Cache,提升模型推理效率。
该行认为,DeepSeek和其他国产模型以开源的方式探索模型进步方法论和工程优化方向,共同促进模型产业的繁荣以及加速AGI时代的到来。
相关内容《大行》花旗首予MiniMax(00100.HK)「买入/高风险」评级 目标价1,330元
该行指,DeepSeek发布V4模型,突破超长上下文效率瓶颈。V4预览版推出两个版本的MoE模型,包括智能水平和定价更高,聚焦完成覆杂任务的V4-Pro以及主打性价比优势的V4-Flash,两个版本模型均支持100万Token的超长上下文,这也是此次V4 系列的核心亮点。该行认为,V4 在超长上下文的突破将赋能模型在Agentic AI领域的加速进步,更高效准确完成覆杂长程任务。
该行认为,V4的优化缓解了HBM的压力,高效释放了各部分存储的效率,SSD进入模型核心推理的趋势显现。看好国产开源大模型的进步趋势,在模型效率的优化下将加速下游Agentic AI的需求释放,看好模型厂商智谱(02513.HK) -114.500 (-12.521%) 沽空 $2.58亿; 比率 13.456% 、MiniMax(00100.HK) -26.500 (-3.533%) 沽空 $1.45亿; 比率 15.805% 。(ha/a)(港股报价延迟最少十五分钟。沽空资料截至 2026-04-28 16:25。)
AASTOCKS新闻