3月1日,DeepSeek“开源(yuán)周”的最后一天,DeepSeek抛出最后一枚“王炸”——首次披露成本(běn)利润率关键信息。
DeepSeek在(zài)社交媒体的官方账号上称:“假定GPU租赁成本(běn)爲(wèi)2美金/小时,总成本(běn)爲(wèi)$87,072/天。……如(rú)果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收(shōu)入爲(wèi)$562,027,成本(běn)利润率545%。”
当然,这只是最理想的情况。
圖(tú)源(yuán):圖(tú)虫創(chuàng)意(yì)
而现实是,DeepSeek开源(yuán)周让行業(yè)振奋。这些开源(yuán)工具不仅让全球AI开发者能更高效、更低成本(běn)地进行AI模型的开发和訓(xùn)练,也让多年来关於(yú)大模型开源(yuán)和闭源(yuán)的“口水仗”,在(zài)这一阶段有了初步结论。
2月,过去坚定的“闭源(yuán)派”百度(dù)(9888.HK)宣布将开源(yuán)下一代文心大模型,之后,字节豆包、昆仑万维等均推出开源(yuán)模型,阿里巴巴(9988.HK)也进一步深化开源(yuán)。
“或主動(dòng)、或被動(dòng),开源(yuán)(大模型)已经被带動(dòng)起来了。”开源(yuán)大模型社区OpenCSG联合創(chuàng)始人、CTO王伟向时代财经感慨。
DeepSeek正在(zài)撼動(dòng)当前AI大模型的市场格局。有行業(yè)人士表示,大模型仍然保持超高速迭代的态势,“过时的”模型几乎无人问津。“在(zài)大模型领域,想利用短期的算法技术优势或商(shāng)業(yè)模式来打造形成长期的竞争壁垒,目前看来是不可(kě)能的。”该業(yè)内人士称。
DeepSeek给开发者们带来福音的同时,也让一些大模型公司可(kě)能不得不“赶鸭子上架(jià)”,“跟风”开源(yuán)。
但(dàn)开源(yuán)之后呢?
DeepSeek可(kě)以(yǐ)测算自己的理论利润率,但(dàn)其他廠(chǎng)商(shāng)是否找到盈利模式?
开闭源(yuán)战局扭转
展开全文
继模型、论文开源(yuán)之后,DeepSeek正向着更底层的开源(yuán)进发。
“DeepSeek开源(yuán)周开源(yuán)的这些技术,能够大大提高推理效率,同样场景和服务规模下,所需GPU数量更少。往大了说,这甚至能达到节能减排的效果。”王伟称,以(yǐ)DeepSeek开源(yuán)项目中涉及到的EP(Expert Parallelism,专家并行)技术爲(wèi)例,过去除了少数头部公司有能力实现,多数企業(yè)是享受不到EP加速的,只能以(yǐ)较低的效率进行推理。
“但(dàn)DeepSeek开源(yuán)后,这一情况有望很快得到改善。开源(yuán)成果将会被其他通用开源(yuán)项目、企業(yè)、科研组织等快速吸收(shōu),地融入到他们的项目之中。”王伟表示。
例如(rú),摩尔线程就在(zài)3月1日晚上宣布在(zài)短时间内成功实现对 DeepSeek 各個(gè)开源(yuán)项目的全面支持,涵(hán)盖 FlashMLA、DeepEP、DeepGEMM、DualPipe 以(yǐ)及 Fire-Flyer 文件系统(3FS)。
“当然,这套技术方案还存在(zài)一些限(xiàn)制,例如(rú)它主要还是针对英伟达的技术架(jià)构,特别是Hopper架(jià)构的显卡,以(yǐ)及针对MOE这类架(jià)构模型的訓(xùn)练和推理等。”王伟补充道。
在(zài)LangGPT社区創(chuàng)始人云中江树看来,DeepSeek的开放程度(dù)直接将大模型应用的门槛基本(běn)拉平了。“它足够开放,没有任何(hé)限(xiàn)制,现在(zài)甚至把部署的底层代码都开放出来,相当於(yú)手把手地教大家如(rú)何(hé)高效部署了。”
据云中江树介绍,目前全球主要有Meta Llama系列模型、阿里千问系列和DeepSeek三個(gè)重要的AI开源(yuán)玩家。开源(yuán)则涉及到模型的权重、訓(xùn)练代码和訓(xùn)练数据三個(gè)层面。
从模型权重来看,这是每個(gè)开源(yuán)玩家都会选择开放的基本(běn)要求,而訓(xùn)练代码和訓(xùn)练数据则几乎没有一家可(kě)以(yǐ)完全开放。
差异主要体现在(zài)开源(yuán)协议上,DeepSeek在(zài)开源(yuán)协议上对商(shāng)用几乎没有任何(hé)限(xiàn)制。从开源(yuán)的广度(dù)来看,也几乎只有DeepSeek能将集群计算、通信等提升能效的代码开放出来。并且在(zài)开源(yuán)可(kě)复现性上,DeepSeek公开了更多訓(xùn)练细节及核心思想,目前社区已有 OpenR1 项目实现完全复制。
圖(tú)源(yuán):圖(tú)虫創(chuàng)意(yì)
更重要的是,DeepSeek完全扭转了关於(yú)大模型开闭源(yuán)的战局。
时代财经从多名業(yè)内人士处了解到,过去一段时间海外大模型开源(yuán)势头有所减弱,硅谷的AI巨头逐步转向闭源(yuán)。王伟提到,美国科技巨头们爲(wèi)了商(shāng)業(yè)化目标,纷纷选择闭源(yuán)作爲(wèi)自身的发展模式,而DeepSeek、Qwen等中国模型则成了开源(yuán)的重要力量。
此前,業(yè)内人士认爲(wèi)开源(yuán)可(kě)能是“伪命题”,比如(rú)李彦宏就曾表示,“开源(yuán)模式是一种智商(shāng)税。”但(dàn)如(rú)今百度(dù)也走到了自己的反面,2025年的2月14日,百度(dù)官方微信发布公告,“我们将在(zài)未来几個(gè)月中陆续推出文心大模型4.5系列,并於(yú)6月30日起正式开源(yuán)。”用短短一句话宣布放弃坚持了两年的闭源(yuán)之路。
“赶鸭子上架(jià)”?
DeepSeek的技术实力匹配开放程度(dù),一时让开源(yuán)成爲(wèi)大模型的主流。
不只百度(dù),多家大模型企業(yè)在(zài)2月推出开源(yuán)模型或进一步深化开源(yuán)。2月10日,字节跳動(dòng)豆包大模型团队联合北京交通大学等开发的眡(shì)频生成实验模型“VideoWorld”正式开源(yuán);2月18日,昆仑万维开源(yuán)了其旗下面向AI短剧創(chuàng)作的眡(shì)频生成模型SkyReels-V1和表情動(dòng)作可(kě)控算法SkyReels-A;2月23日,月之暗面Kimi宣布开源(yuán)大模型Moonlight。
另外一家大模型廠(chǎng)商(shāng)阿里云则是一直开源(yuán)和闭源(yuán)两条腿走路的。2月25日,阿里通义千问推出QwQ-Max-Preview深度(dù)思考模型,支持联网搜索,并计划后续开源(yuán)。当日深夜,阿里云眡(shì)觉生成基座模型万相2.1(Wan)开源(yuán)了14B和1.3B两個(gè)参数规格的全部推理代码和权重,同时支持文生眡(shì)频和圖(tú)生眡(shì)频任务,本(běn)地消费级GPU即可(kě)部署。
圖(tú)源(yuán):圖(tú)虫創(chuàng)意(yì)
顶着DeepSeek的风暴,廠(chǎng)商(shāng)们选择开源(yuán)背后的動(dòng)力,是創(chuàng)新,是跟风,还是“赶鸭子上架(jià)”?
在(zài)近期百度(dù)财报电话会议上,百度(dù)創(chuàng)始人兼CEO李彦宏解释了促使百度(dù)做出这一艰难抉择背后的原因。
李彦宏称,“开源(yuán)最好的模型可(kě)以(yǐ)极大地促进采用”,并希望通过开源(yuán)让开发者和用户认识到文心系列大模型的真正价值。
“促进采用”的背后,可(kě)能蕴藏着更深层的生态战位。
王伟表示,DeepSeek一系列模型开源(yuán)之后,国内外从芯片到Infra框架(jià),再到应用层,几乎都快速去做适配。这股风潮甚至超过了之前Meta开源(yuán)的Llama模型。
据时代财经此前报道,单是芯片廠(chǎng)商(shāng),截至2月中旬就有超过15家紧急适配了DeepSeek系列模型,包括华爲(wèi)昇腾、壁仞科技、昆仑芯、沐曦、云天励飞(688343.SH)、摩尔线程等廠(chǎng)商(shāng),并且更深入的适配工作仍在(zài)进行中。
王伟进一步解释,当一個(gè)新架(jià)构的模型推向市场时,会面临在(zài)芯片、框架(jià)和应用等軟(ruǎn)硬件生态适配问题,需要投(tóu)入人力去攻克。这個(gè)周期较长,很多时候没有生态工具来助力,最后,往往是廠(chǎng)商(shāng)花费大量资金解决这個(gè)问题,最终由用户来买单。
如(rú)今,DeepSeek则通过强大的模型能力和有效的开源(yuán)策略快速跨过了适配难关。其他模型廠(chǎng)商(shāng)如(rú)果仍坚持商(shāng)業(yè)化全闭源(yuán)策略,那么除了API接入外,私有化部署的生态适配会维持在(zài)高成本(běn)状态,这会大大削弱这些廠(chǎng)商(shāng)的竞争力。
“如(rú)同Llama开源(yuán)后催生了一批基於(yú)Llama的生态项目,目前整個(gè)AI生态都在(zài)与DeepSeek兼容。甚至,尽管DeepSeek还处於(yú)发展中,估计过一两年,它可(kě)能就会成爲(wèi)AI领域的‘安卓系统’。”云中江树同样认爲(wèi),开源(yuán)是融入进大模型生态中最好的办法。
如(rú)果企業(yè)自己开发一套闭源(yuán)的、较小的系统,而其他廠(chǎng)商(shāng)不与之兼容,軟(ruǎn)件也无法适配,那么自然而然地,其他廠(chǎng)商(shāng)和用户都不会选择这样的系统,甚至可(kě)能会面临被淘汰的风险。
因此,主動(dòng)也好,“赶鸭子上架(jià)”也好,开源(yuán)成爲(wèi)大模型廠(chǎng)商(shāng)不得不考虑的选项。
另外,从融资的角度(dù)看,一家风险投(tóu)资机构负责人告诉时代财经,能不能选择开源(yuán)一定是接下来投(tóu)大模型一個(gè)非常重要的指标。
“不是说开源(yuán)就领先闭源(yuán),而是你可(kě)以(yǐ)闭源(yuán),但(dàn)是开源(yuán)可(kě)能会在(zài)更短的周期内追上你,那么你的竞争优势还在(zài)不在(zài)模型本(běn)身,或者说竞争优势还能不能持续这件事,是需要大家更多去考量的。”上述负责人表示。
一名業(yè)内人士对时代财经坦言:“一個(gè)残酷的事实是: DeepSeek开源(yuán)了,原来的大模型坚持的闭源(yuán)私有化商(shāng)業(yè)模式就不成立了。”
开源(yuán)之后呢?
闭源(yuán)的商(shāng)業(yè)模式受到冲击,但(dàn)是对於(yú)开源(yuán)大模型如(rú)何(hé)实现商(shāng)業(yè)化也是很多企業(yè)的的未解难题。
在(zài)上述风险投(tóu)资机构负责人看来,DeepSeek的商(shāng)業(yè)化路径并没有非常清晰。“这也是开源(yuán)一直存在(zài)的问题,过往在(zài)軟(ruǎn)件行業(yè)通过开源(yuán)获得巨大成功的公司在(zài)美国有出现过,在(zài)国内确实尚未看到相关案例。”更何(hé)况,从DeepSeek 的創(chuàng)始人梁文锋的对外表态来看,他是一位技术理想主义者,而非爲(wèi)了盈利目的。
不过,云中江树也指出,在(zài)目前大模型的发展阶段,即使是闭源(yuán),其商(shāng)業(yè)化本(běn)身也并不理想,如(rú)OpenAI、Grok等头部模型的盈利能力也不强。底层的原因是,当前大模型的智能化水平尚未达到真正商(shāng)業(yè)化落地的要求。
DeepSeek在(zài)《DeepSeek-V3 / R1 推理系统概览》中指出,由於(yú)DeepSeek-V3定价低於(yú)R1,且网页端和应用程序免费,仅部分服务产生收(shōu)入,再加上非高峰时段设有夜间折扣,其实际收(shōu)入不及理论数值。
圖(tú)源(yuán):DeepSeek官方账号
“其他公司想快速做到(像DeepSeek)这么好,并不容易。”据王伟透露,几家知名的DeepSeek R1 API供应商(shāng)的利润率远不如(rú)DeepSeek自己。但(dàn)在(zài)此次开源(yuán)周之后,这個(gè)情况有望改善。
王伟认爲(wèi),短期内, DeepSeek的开源(yuán)会让模型廠(chǎng)商(shāng)面临很大的压力,大量的研发投(tóu)入也可(kě)能会被质疑。但(dàn)长期来看,大模型的竞争远没有结束,各模型廠(chǎng)商(shāng)如(rú)果能适当吸收(shōu)DeepSeek的开源(yuán)成果,拿出更竞争力的模型,未来是有可(kě)能反超的。长期看好中国的大模型企業(yè),国内有多家基础模型廠(chǎng)商(shāng)具备与DeepSeek相当的实力。
“开源(yuán)也有其独特的商(shāng)業(yè)模式。”云中江树表示,一种是免费提供模型,但(dàn)出售相关服务来盈利,比如(rú)帮助企業(yè)需要将模型部署到自己的公司,进行性能调优、本(běn)地部署、专项能力提升等;其次是实行双轨制,即开源(yuán)和闭源(yuán)并行,一些基础的或较小的模型开源(yuán)以(yǐ)吸引(yǐn)人气,而高级版、较大规模的模型则闭源(yuán)出售;还有一种策略如(rú)埃隆·马斯克旗下的xAI公司,它的策略是开源(yuán)上一代Grok模型,而最新一代模型则采用闭源(yuán)等。
“不过,无论是哪一种商(shāng)業(yè)模式,目前没有商(shāng)業(yè)化诉求的DeepSeek可(kě)能还是一個(gè)很大的变量和异数。”云中江树说。
(时代财经庞宇对此文亦有贡献)
本(běn)网站上的内容(包括但(dàn)不限(xiàn)於(yú)文字、圖(tú)片及音眡(shì)频),除转载外,均爲(wèi)时代在(zài)线版权所有,未经书面协议授权,禁止转载、链接、转贴或以(yǐ)其他 方式使用。违反上述声明者,本(běn)网将追究其相关法律责任。如(rú)其他媒体、网站或個(gè)人转载使用,请联系本(běn)网站丁先生:news@time-weekly.com
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。