DeepSeek开源V4模型,参数规模达1.6万亿

2026-04-24 / 2 阅读

Odaily星球日报讯 DeepSeek 发布 V4 系列开源模型预览版,采用 MIT 许可,权重已上线 Hugging Face 与 ModelScope。该系列包含两款 MoE 模型,其中 V4-Pro 总参数约 1.6 万亿、单 token 激活 490 亿参数,V4-Flash 总参数 2840 亿、激活 130 亿参数,均支持 100 万 token 上下文。官方表示,相较 V3.2 版本,其在长文本推理中显存占用与计算开销均显著降低。

0