
|
DeepSeek携新版本回归
AI产业自主可控生态稳步形成
◎记者 杨烨
4月24日,DeepSeek-V4预览版本正式上线并同步开源,这款搭载全新注意力机制的大模型,不仅能实现全球领先的长上下文处理能力,更以模型架构的创新突破,为中国AI产业开辟出一条“软硬协同,自主可控”的全新路径。
“这是DeepSeek的强势回归。”瀚博半导体一位高管说。一段时间以来,国内其他主流大模型持续高速迭代,热闹非凡。相比之下,DeepSeek却鲜有重磅更新,综合排名与行业存在感被持续拉开差距。如今正式发力,与公司近期启动外部融资相映成趣。
有业内专家认为,相较技术层面的迭代突破,DeepSeek-V4发布的更深层价值,在于推动国内AI算力尤其是推理算力生态完成从依赖进口到自主可控的关键跨越,成为国产算力产业崛起的重要转折点。随着国产大模型加速落地普及,国产AI算力的规模化应用进程也将全面提速。
击穿行业“成本线”
公开信息显示,DeepSeek-V4所取得的突破并非单纯参数扩容,而是通过多项原理和架构创新实现“性能跃升+成本陡降”的双重跨越,解决长上下文、深度推理场景下的算力与成本痛点。
该系列模型分为两个版本:DeepSeek-V4-Pro作为旗舰版本,性能比肩顶级闭源模型,在Agent能力、世界知识和推理性能上表现突出;DeepSeek-V4-Flash则定位为轻量高效的经济之选,适配规模化普惠场景。
从核心参数来看,两款模型均搭载混合注意力架构(CSA+HCA)、流形约束超连接(mHC)及Muon优化器,在100万词元上下文场景下,DeepSeek-V4-Pro单词元推理计算量仅为前代V3.2的27%,KV缓存内存占用缩减至10%,长文本处理效率实现质变。
相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,DeepSeek-V4-Pro已达到当前开源模型最佳水平,并在其他多项基准测试中同样表现优异,达到甚至局部超过Opus-4.6等模型的水准。
值得关注的是,与OpenAI GPT-5.5等海外闭源模型形成鲜明对比,DeepSeek-V4以“普惠定价+MIT开源”双策略,彻底打破高水准AI旗舰模型对普通用户来说价格过高的格局。尤其在2026年以来主要模型、推理云服务的词元资费大幅度上涨的情况下,DeepSeek再次击穿行业成本线,对人工智能应用普及意义重大。
专注于推理芯片的国产GPU龙头企业瀚博半导体高管表示,DeepSeek-V4将利好国产算力及AI应用,推动国产AI产业链再上新台阶。
定价方面:DeepSeek-V4-Flash API输入定价低至0.2元/百万词元(缓存命中)、1元/百万词元(缓存未命中),输出定价2元/百万词元;而同期OpenAI GPT-5.5输出定价达30美元/百万词元,价格差距达100倍。
此外,DeepSeek-V4全系采用MIT协议完全开源,支持本地部署与二次开发,中小企业、开发者可免费使用百万上下文能力,无须为此额外支付授权费,直接降低AI应用开发门槛,加速AI技术从“昂贵订阅”向“普惠工具”转变。
国产AI产业链进入长期上升周期
随着Agent应用的爆发,AI推理成为决定产业商业化速度和渗透深度的核心领域,而AI算力卡尤其是国产算力供应则是需要重点解决的发展瓶颈。
上海财经大学特聘教授胡延平表示,DeepSeek-V4的意义不仅是模型再一次达到全球一线水准,还在于弥补了国产AI算力卡的短板,FP4和FP8精度之下,使用同样的算力卡,模型能承接更多推理任务。
值得一提的是,DeepSeek-V4将适配机会全部留给了华为、寒武纪等国内企业,其目标是推动AI生态从CUDA生态向华为CANN框架等国产算力生态整体迁移,为国产算力的大规模应用进一步打开了突破口。
此前,市场对国产算力的预期大多停留在“自主可控”的局部试用层面,而DeepSeek-V4的落地,将这一逻辑推进到“好用且必需”的商业层面。胡延平认为,国产AI大模型对国产算力的大规模应用就在今年,AI产业链从此进入正向循环。
目前,华为昇腾、天数智芯、寒武纪等国产芯片厂商已实现对DeepSeek-V4新模型的支持。4月24日,寒武纪宣布,已基于vLLM推理框架,完成了DeepSeek-V4-Flash和DeepSeek-V4-Pro的Day0适配,适配代码已开源至GitHub社区。此外,华为昇腾超节点全系列产品已支持DeepSeek-V4系列模型。
厦门大学经济学院教授孙传旺认为,随着模型的持续迭代和开源生态的不断完善,国产AI与算力产业链将进一步协同发力,有望进入长周期景气上行通道,相关产业机遇值得持续关注。
近期,DeepSeek启动了成立以来的首次外部融资。业内人士认为,资本化之路将为DeepSeek参与全球大模型竞争提供更为充足的资金弹药,本次融资可能将用于扩充算力资源、提高薪酬待遇以留住顶尖人才,同时为大模型的研发、落地和大规模部署提供支持。
在AI应用领域,DeepSeek-V4的架构创新将加快行业落地进程。孙传旺表示,推理成本的大幅降低,让大模型成为廉价的基础设施,显著降低了中小团队和行业应用的门槛,尤其是有利于边缘AI推理的规模化部署,推动金融、法律、医疗、工业等领域AI应用发展。
在多位业内人士看来,这场由DeepSeek引发的架构革命,不仅让国产算力摆脱了对高端进口芯片的过度依赖,还推动中国AI产业从“拼算力”向“拼创新”转型。随着DeepSeek-V4的全面落地,以及国产芯片厂商的持续发力,AI产业链的利润分配将进一步向本土企业倾斜,自主可控的产业生态正在加快形成。
海量资讯、精准解读,尽在新浪财经APP
金斧子配资提示:文章来自网络,不代表本站观点。