
一边说利润率可以高达545%,另一边说“部署后一个月亏损4亿”,近日,关于部署DeepSeek到底是赚钱还是亏钱的事在网络上引发了一场争论。3月1日,DeepSeek在开源周的最后,公布其模型理论上的成本利润率可以高达545%,在人们为此惊叹的同时,AI基础设施企业潞晨科技创始人尤洋发出了不同声音,他的一则“部署DeepSeek月亏4亿”的发言让其成为舆论风暴的中心。潞晨科技随后宣布停用DeepSeek的行为,也让人们重新审视MaaS(模型即服务)这一商业模式。

何为MaaS服务?为何提供MaaS服务的企业存在“用户越多亏损越多”的(de)现(xiàn)象(xiàng)?MaaS是(shì)一(yī)门(mén)好生意吗?
如果大模型是煤炭,MaaS就是电厂
MaaS的出现,是一种商业范式的转变。
要想使用大模型,对于个人用户来说,除了使用模型的APP、网页版,还可以自己下载DeepSeek等开源模型部署到本地,享受更私域的定制化服务,但这类部署可能存在运行不稳定等情况。对于企业用户(hù)来(lái)说(shuō),这(zhè)种(zhǒng)不(bù)稳(wěn)定(dìng)是(shì)无(wú)法(fǎ)接受的,因此MaaS的需求就产生了。
所谓MaaS,就是将模型部署到企业端提供给用户使用的服务。MaaS服务商部署好模型后,提供API接口,企业用户可以通过API接口直接调用,按token计价。MaaS模式可提供专业的模型部署,让模型运行更快,企业按token调用不仅可以享受更好的服务,稳定性和并发性高,而且成本更低。
“如果大模型是煤炭,那么MaaS就是电厂,它将煤炭变成了人人可以方便使用的电。”王铁震解释,“不用MaaS也可以,那就需要自己盖发电机,成本高,一些比较大的项目用 ‘发电机’是没法做的。”王铁震表示,未来每一个企业用户每天可能会“烧掉”几亿token,作为标品的MaaS将成为越来越重要的基础服务。
云厂商是提供MaaS服务的一大主力,因为对于它们来说,提供MaaS服务为其原有服务增加了一个新的项目,可以更好地利用闲置算力。以往企业按时间向云厂商租借算力,一个2小时的计算任务需要租赁2小时时长的8张A100本地计算卡。“由于算力需求波动,GPU利用率可能只有50%。”Hugging Face工程师王铁震表示,这种模式导致算力被大量闲置在“等用户”的过程中。
作为连接大模型底层算力和下游应用的中间层,类似潞晨科技这样的AI Infra(AI基础设施)企业也是MaaS服务商的另一类主力。AI Infra厂商所做的工作涵盖了数据准备、模型训练、部署和应用整合等,将原始算力资源加工成符合用户需求的“成品菜”。
自身没有模型的厂商要想经营MaaS商业模式,离不开开源模型。MaaS的产业链(liàn)格(gé)局(jú)分(fēn)成(chéng)三(sān)大(dà)板(bǎn)块(kuài),一(yī)是(shì)创(chuàng)造(zào)模(mó)型(xíng)的(de)企(qǐ)业(yè)将(jiāng)模(mó)型(xíng)发(fā)布(bù)在(zài)如(rú)Hugging Face这(zhè)样(yàng)的(de)开(kāi)源(yuán)社(shè)区(qū);二(èr)是(shì)MaaS服(fú)务(wu)商(shāng)将(jiāng)模(mó)型(xíng)从(cóng)Hugging Face上(shàng)下(xià)载(zài)、部(bù)署(shǔ)、优(yōu)化(huà),做(zuò)好(hǎo)并(bìng)发(fā)调(diào)度(dù)等(děng)管(guǎn)理(lǐ);三(sān)是(shì)应(yīng)用(yòng)开发企业调用token。因为有了开源模型,MaaS的商业模式才成立,所以在DeepSeek这样的开源模型爆火后,助推了一把MaaS,成为了MaaS服务商的流量密码。
据报道,国内最早部署DeepSeek的AI Infra企业硅基流动自上线DeepSeek R1/V3推理服务后,流量增长了数十倍。
虽然带来了流量,但这个商业模式现在到底能不能带来盈利,大家的意见显然不太一致。
月亏4亿的核心成本是算力
尽管DeepSeek称他们的理论利润率达到了545%,但尤洋却表示“月亏4亿”。“满血版的DeepSeek R1每日输出1000亿token,每月机器成本是4.5亿,亏损4亿,用户越多亏损越多。”在尤洋发表这番言论后不久,3月1日,潞晨科技宣布一周后暂停DeepSeek API服务。
对于“月亏4亿”的言论,尤洋在对媒体的回应中表示,相对于火山云、阿里云等头部企业,“类似我们这样中小型企业去强行烧钱,使用第三方开源模型做MaaS的话,肯定是(shì)面(miàn)临(lín)巨(jù)额(é)亏(kuī)损(sǔn)。”尤(yóu)洋(yáng)表(biǎo)示(shì),“初(chū)创(chuàng)企(qǐ)业(yè)即(jí)使(shǐ)融(róng)了(le)几(jǐ)个(gè)亿(yì),可(kě)能(néng)还(hái)没(méi)大(dà)厂(chǎng)一(yī)个(gè)月(yuè)的(de)营(yíng)销(xiāo)推(tuī)广(guǎng)费(fèi)高(gāo)。我(wǒ)觉(jué)得(de)只(zhǐ)使(shǐ)用(yòng)第(dì)三(sān)方(fāng)开(kāi)源(yuán)模型以当下的MaaS模式卖API的话,肯定是亏的。”
一位AI Infra从业者对澎湃科技表示,MaaS公司目前有两种收费模式:一是企业调用API,按token结算;二是月费会员,例如OpenAI有Pro用户、Plus用户等。国内MaaS公司以前者为主,按token结算实际上是按算力结算,“每秒钟推理多少数据、输出多少token,这其实和算力的价格完全绑定,核心成本就是算力。”在这种模式下,“客户越多亏得越多其实也比较合理,因为目前国内模型的API都在降价,本身价格比较低,譬如DeepSeek-R1官方售价是百万token 16元。”
该从业者解释,如果MaaS企业只提供API服务,没有自己的模型、没有足够的算力,“顶多用几十台小集群来做,一定是亏的,做多少亏多少。”他认为这主要由MaaS的商业模式所引起的,从OpenAI的营收比例中可见一斑。“API只占OpenAI营收的30%,70%的利润来自包月用户。因为包月用户实际上跑不了那么多算力,所以是赚钱的,利润率很高。”
“这就是为什么市面上为大模型公司供给服务器的‘裸金属企业’的销售模式一定不是一个很好的商业模式。”该从业者表示,token是销售成本,对于MaaS企业来说,卖得越多亏得越多,因此对成本“特别敏感”。
宁愿亏钱也愿意先圈用户
王铁震同样提到,算力成本是决定MaaS定价的(de)重(zhòng)要因素。MaaS服务商的类别多样,其算力来源也多样,有的可能来自企业自身机房,也可能按小时向云厂商租赁,有的或来自闲置的算力中心。每家MaaS企业(yè)每(měi)小(xiǎo)时(shí)的(de)GPU成(chéng)本(běn)不(bù)同(tóng),若(ruò)使(shǐ)用(yòng)国(guó)内(nèi)算(suàn)力(lì)中(zhōng)心(xīn)的(de)闲置算(suàn)力(lì),那(nà)么(me)唯(wéi)一(yī)的(de)成(chéng)本(běn)就(jiù)是(shì)电(diàn)费(fèi)。算(suàn)力(lì)成(chéng)本(běn)的(de)不(bù)同(tóng)在(zài)很(hěn)大(dà)程(chéng)度(dù)上(shàng)决(jué)定(dìng)了(le)提(tí)供(gōng)MaaS这(zhè)项(xiàng)服(fú)务(wu)能(néng)否(fǒu)赚(zhuàn)钱(qián)。
此(cǐ)外(wài),技(jì)术(shù)和(hé)市(shì)场(chǎng)竞(jìng)争(zhēng)等(děng)因(yīn)素(sù)也(yě)会(huì)影(yǐng)响(xiǎng)MaaS企(qǐ)业(yè)定(dìng)价(jià)。他(tā)表(biǎo)示(shì),前(qián)沿(yán)的(de)技(jì)术(shù)有(yǒu)助(zhù)于(yú)提(tí)升(shēng)MaaS企(qǐ)业(yè)“煤(méi)转(zhuǎn)电(diàn)”的(de)效(xiào)率(lǜ)。业(yè)内(nèi)基(jī)于(yú)开(kāi)源(yuán)技(jì)术(shù)提(tí)供(gōng)服(fú)务(wu)、计(jì)算(suàn)成(chéng)本(běn),“如(rú)果(guǒ)连(lián)开(kāi)源(yuán)的(de)Infra效(xiào)果(guǒ)都(dōu)达(dá)不(bù)到(dào),基(jī)本(běn)上(shàng)就(jiù)出(chū)局(jú)了(le)。”当(dāng)然(rán),一(yī)个(gè)MaaS公(gōng)司(sī)的(de)部(bù)署(shǔ)如(rú)果(guǒ)有(yǒu)各(gè)种(zhǒng)bug(漏(lòu)洞(dòng)),也(yě)会(huì)反(fǎn)映(yìng)在(zài)成(chéng)本(běn)上(shàng)。
但(dàn)每(měi)个(gè)人(rén)的(de)认(rèn)知(zhī)都(dōu)有(yǒu)局(jú)限(xiàn)。由(yóu)于(yú)行(xíng)业(yè)并(bìng)未(wèi)充(chōng)分(fēn)开(kāi)源(yuán),不(bù)同(tóng)背(bèi)景(jǐng)的(de)技(jì)术(shù)开(kāi)发(fā)者(zhě)选(xuǎn)择(zé)不(bù)同(tóng)路线(xiàn),不(bù)在(zài)一(yī)个(gè)技(jì)术(shù)维(wéi)度(dù)竞(jìng)争(zhēng),认(rèn)知(zhī)不(bù)对(duì)齐(qí),也(yě)就(jiù)无(wú)法(fǎ)预(yù)估(gū)他(tā)人(rén)的(de)成(chéng)本(běn)。不(bù)过(guò),DeepSeek开(kāi)源(yuán)Infra项(xiàng)目(mù)源(yuán)代(dài)码(mǎ),帮(bāng)助(zhù)对(duì)齐(qí)认(rèn)知(zhī),“以(yǐ)前(qián)模(mó)型(xíng)开(kāi)发(fā)者(zhě)可(kě)能(néng)从(cóng)未(wèi)想(xiǎng)到(dào)还(hái)能(néng)用(yòng)CUDA一(yī)个(gè)没(méi)有(yǒu)公(gōng)开(kāi)的(de)API才(cái)能(néng)把(bǎ)成(chéng)本(běn)降(jiàng)下(xià)来(lái),现(xiàn)在(zài)拉(lā)齐(qí)认(rèn)知(zhī)。”DeepSeek实(shí)现(xiàn)PTX编(biān)程(chéng),能(néng)够(gòu)直(zhí)接(jiē)和(hé)底(dǐ)层(céng)硬(yìng)件(jiàn)发(fā)生(shēng)交(jiāo)互(hù)的(de)PTX一(yī)般(bān)被(bèi)隐(yǐn)藏(cáng)在(zài)CUDA的(de)驱(qū)动(dòng)中。王铁震表示,在确定的方向上“卷”就可以继续把token价格打下去,技术迭代更快,促进需求上涨。“对于工程师个人而言,既兴(xìng)奋(fèn),又(yòu)觉(jué)得(de)压(yā)力(lì)变(biàn)大(dà)了(le),因(yīn)为(wèi)还(hái)要(yào)学(xué)更(gèng)多(duō)东(dōng)西(xi)。”
王(wáng)铁(tiě)震(zhèn)说(shuō),DeepSeek开(kāi)源(yuán)提(tí)高(gāo)了(le)行(xíng)业(yè)基(jī)准(zhǔn),促(cù)进(jìn)业(yè)内(nèi)进(jìn)一(yī)步(bù)降(jiàng)低(dī)API调(diào)用(yòng)价(jià)格(gé)。“以(yǐ)前(qián)大(dà)家(jiā)用(yòng)开(kāi)源(yuán)的(de)大(dà)模(mó)型(xíng)发(fā)现(xiàn)成(chéng)本(běn)巨(jù)高(gāo),只(zhǐ)能(néng)砸(zá)钱(qián)、砸(zá)补(bǔ)贴(tiē)、买(mǎi)用(yòng)户(hù)。DeepSeek开(kāi)源(yuán)后(hòu)大(dà)家(jiā)都(dōu)用(yòng)起(qǐ)来(lái),都(dōu)开(kāi)始(shǐ)赚(zhuàn)钱(qián)了(le)。这(zhè)时(shí)候(hou)有(yǒu)人(rén)就(jiù)想(xiǎng),要(yào)不(bù)把(bǎ)价(jià)格(gé)再(zài)降(jiàng)一(yī)降(jiàng),然(rán)后(hòu)大(dà)家(jiā)又(yòu)不(bù)赚(zhuàn)钱(qián)了(le),就(jiù)开(kāi)始(shǐ)想(xiǎng)下(xià)一(yī)代(dài)的(de)技(jì)术(shù)核(hé)心(xīn)。”因(yīn)此(cǐ),MaaS服(fú)务(wu)商(shāng)要(yào)把(bǎ)服(fú)务(wu)卖(mài)出去,还要看竞争对手的价格,“如果卖得明显比别人贵很多,就算其他地方都很好也不行。”
虽然纯卖API接口的账怎么算也算不过来,但大家争先恐后接入DeepSeek也不单纯是为蹭热点。尤洋也表示,“如果它(MaaS)作为一个功能点提供到其他产品里,最终通过产品赚钱,是有可能的。”他坦言,大厂的优化手段和可选方案或许比中小型厂商会更好,可能收回更多成本。再加上大厂长远的战略性布局,即使短期内有亏损,日后通过这些超级APP和其他业务也是可以消耗大量token的,再通过一些额外付费或整体业务考虑,就可以把亏损补回来。
对于MaaS服务商来说,还可以为各行各业的企业用户提供整体解决方案,如果将MaaS服务作为整体解决方案打包出售而非单纯销售API,就会获得溢价。在业内人士看来,如果未来AI Infra企业的赚钱逻辑要改变,会从为垂直大模型厂商提供MaaS转向为各行各业的用(yòng)户提供服务,MaaS服务将走向更加垂直的领域,扩大服务范围,改变服务方式。
王铁震表示,MaaS行业当前处于早期无序竞争格局,企业宁愿亏钱也愿意先销售服务、收获用户,所以当前的MaaS定价并不能完全反映实际成本。“国内所有行业都在卷。如果一个行业不卷,可能是因为大家都没有意识到这个行业有巨大潜力,卷起来之后就会凸显出谁才是这个行业真正的技术领先者。”在他看来,国内AI Infra行业还有巨大提升空间,“能看到未来这里面有巨大潜力,提高token输出速度,降低token价格,加速技术进步。”
3月11日,硅基流动宣布,DeepSeek API升级,DeepSeek-V3批量推理价格降低50%,3月11日-18日DeepSeek-R1批量推理(lǐ)价(jià)格(gé)降(jiàng)低(dī)75%,输(shū)入(rù)价(jià)格(gé)1元(yuán)/百(bǎi)万(wàn)Token、输(shū)出(chū)价(jià)格(gé)4元(yuán)/百(bǎi)万(wàn)Token。