冬瓜网:tttzzzsu黑料入口吃瓜-用户越多亏损越多 ?DeepSeek带火的MaaS究竟是不是门好生意
一边说利润率可以高达545%,另一边说“部署后一个月亏损4亿”,近日,关于部署DeepSeek到底是赚钱还是亏钱的事在网络上引发了一场争论。3月1日,DeepSeek在开源周的最后,公布其模型理论上的成本利润率可以高达545%,在人们为此惊叹的同时,AI基础设施企业潞晨科技创始人尤洋发出了不同声音,他的一则“部署DeepSeek月亏4亿”的发言让其成为舆论风暴的中心。潞晨科技随后宣布停用DeepSeek的行为,也让人们重新审视MaaS(模型即服务)这一商业模式。
何为MaaS服务?为何提供MaaS服务的企业存在“用户越多亏损越多”的现象?MaaS是一门好生意吗?
如果大模型是煤炭,MaaS就是电厂
MaaS的出现,是一种商业范式的转变。
要想使用大模型,对于个人用户来说,除了使用模型的APP、网页版,还可以自己下载DeepSeek等开源模型部署到本地,享受更私域的定制化服务,但这类部署可能存在运行不稳定等情况。对于企业用户来说,这种不稳定是无法接受的,因此MaaS的需求就产生了。
所谓MaaS,就是将模型部署到企业端提供给用户使用的服务。MaaS服务商部署好模型后,提供API接口,企业用户可以通过API接口直接调用,按token计价。MaaS模式可提供专业的模型部署,让模型运行更快,企业按token调用不仅可以享受更好的服务,稳定性和并发性高,而且成本更低。
“如果大模型是煤炭,那么MaaS就是电厂,它将煤炭变成了人人可以方便使用的电。”王铁震解释,“不用MaaS也可以,那就需要自己盖发电机,成本高,一些比较大的项目用 ‘发电机’是没法做的。”王铁震表示,未来每一个企业用户每天可能会“烧掉”几亿token,作为标品的MaaS将成为越来越重要的基础服务。
云厂商是提供MaaS服务的一大主力,因为对于它们来说,提供MaaS服务为其原有服务增加了一个新的项目,可以更好地利用闲置算力。以往企业按时间向云厂商租借算力,一个2小时的计算任务需要租赁2小时时长的8张A100本地计算卡。“由于算力需求波动,GPU利用率可能只有50%。”Hugging Face工程师王铁震表示,这种模式导致算力被大量闲置在“等用户”的过程中。
作为连接大模型底层算力和下游应用的中间层,类似潞晨科技这样的AI Infra(AI基础设施)企业也是MaaS服务商的另一类主力。AI Infra厂商所做的工作涵盖了数据准备、模型训练、部署和应用整合等,将原始算力资源加工成符合用户需求的“成品菜”。
自身没有模型的厂商要想经营MaaS商业模式,离不开开源模型。MaaS的产业链格局分成三大板块,一是创造模型的企业将模型发布在如Hugging Face这样的开源社区;二是MaaS服务商将模型从Hugging Face上下载、部署、优化,做好并发调度等管理;三是应用开发企业调用token。因为有了开源模型,MaaS的商业模式才成立,所以在DeepSeek这样的开源模型爆火后,助推了一把MaaS,成为了MaaS服务商的流量密码。
据报道,国内最早部署DeepSeek的AI Infra企业硅基流动自上线DeepSeek R1/V3推理服务后,流量增长了数十倍。
虽然带来了流量,但这个商业模式现在到底能不能带来盈利,大家的意见显然不太一致。
月亏4亿的核心成本是算力
尽管DeepSeek称他们的理论利润率达到了545%,但尤洋却表示“月亏4亿”。“满血版的DeepSeek R1每日输出1000亿token,每月机器成本是4.5亿,亏损4亿,用户越多亏损越多。”在尤洋发表这番言论后不久,3月1日,潞晨科技宣布一周后暂停DeepSeek API服务。
对于“月亏4亿”的言论,尤洋在对媒体的回应中表示,相对于火山云、阿里云等头部企业,“类似我们这样中小型企业去强行烧钱,使用第三方开源模型做MaaS的话,肯定是面临巨额亏损。”尤洋表示,“初创企业即使融了几个亿,可能还没大厂一个月的营销推广费高。我觉得只使用第三方开源模型以当下的MaaS模式卖API的话,肯定是亏的。”
一位AI Infra从业者对澎湃科技表示,MaaS公司目前有两种收费模式:一是企业调用API,按token结算;二是月费会员,例如OpenAI有Pro用户、Plus用户等。国内MaaS公司以前者为主,按token结算实际上是按算力结算,“每秒钟推理多少数据、输出多少token,这其实和算力的价格完全绑定,核心成本就是算力。”在这种模式下,“客户越多亏得越多其实也比较合理,因为目前国内模型的API都在降价,本身价格比较低,譬如DeepSeek-R1官方售价是百万token 16元。”
该从业者解释,如果MaaS企业只提供API服务,没有自己的模型、没有足够的算力,“顶多用几十台小集群来做,一定是亏的,做多少亏多少。”他认为这主要由MaaS的商业模式所引起的,从OpenAI的营收比例中可见一斑。“API只占OpenAI营收的30%,70%的利润来自包月用户。因为包月用户实际上跑不了那么多算力,所以是赚钱的,利润率很高。”
“这就是为什么市面上为大模型公司供给服务器的‘裸金属企业’的销售模式一定不是一个很好的商业模式。”该从业者表示,token是销售成本,对于MaaS企业来说,卖得越多亏得越多,因此对成本“特别敏感”。
宁愿亏钱也愿意先圈用户
王铁震同样提到,算力成本是决定MaaS定价的重要因素。MaaS服务商的类别多样,其算力来源也多样,有的可能来自企业自身机房,也可能按小时向云厂商租赁,有的或来自闲置的算力中心。每家MaaS企业每小时的GPU成本不同,若使用国内算力中心的闲置算力,那么唯一的成本就是电费。算力成本的不同在很大程度上决定了提供MaaS这项服务能否赚钱。
此外,技术和市场竞争等因素也会影响MaaS企业定价。他表示,前沿的技术有助于提升MaaS企业“煤转电”的效率。业内基于开源技术提供服务、计算成本,“如果连开源的Infra效果都达不到,基本上就出局了。”当然,一个MaaS公司的部署如果有各种bug(漏洞),也会反映在成本上。
但每个人的认知都有局限。由于行业并未充分开源,不同背景的技术开发者选择不同路线,不在一个技术维度竞争,认知不对齐,也就无法预估他人的成本。不过,DeepSeek开源Infra项目源代码,帮助对齐认知,“以前模型开发者可能从未想到还能用CUDA一个没有公开的API才能把成本降下来,现在拉齐认知。”DeepSeek实现PTX编程,能够直接和底层硬件发生交互的PTX一般被隐藏在CUDA的驱动中。王铁震表示,在确定的方向上“卷”就可以继续把token价格打下去,技术迭代更快,促进需求上涨。“对于工程师个人而言,既兴奋,又觉得压力变大了,因为还要学更多东西。”
王铁震说,DeepSeek开源提高了行业基准,促进业内进一步降低API调用价格。“以前大家用开源的大模型发现成本巨高,只能砸钱、砸补贴、买用户。DeepSeek开源后大家都用起来,都开始赚钱了。这时候有人就想,要不把价格再降一降,然后大家又不赚钱了,就开始想下一代的技术核心。”因此,MaaS服务商要把服务卖出去,还要看竞争对手的价格,“如果卖得明显比别人贵很多,就算其他地方都很好也不行。”
虽然纯卖API接口的账怎么算也算不过来,但大家争先恐后接入DeepSeek也不单纯是为蹭热点。尤洋也表示,“如果它(MaaS)作为一个功能点提供到其他产品里,最终通过产品赚钱,是有可能的。”他坦言,大厂的优化手段和可选方案或许比中小型厂商会更好,可能收回更多成本。再加上大厂长远的战略性布局,即使短期内有亏损,日后通过这些超级APP和其他业务也是可以消耗大量token的,再通过一些额外付费或整体业务考虑,就可以把亏损补回来。
对于MaaS服务商来说,还可以为各行各业的企业用户提供整体解决方案,如果将MaaS服务作为整体解决方案打包出售而非单纯销售API,就会获得溢价。在业内人士看来,如果未来AI Infra企业的赚钱逻辑要改变,会从为垂直大模型厂商提供MaaS转向为各行各业的用户提供服务,MaaS服务将走向更加垂直的领域,扩大服务范围,改变服务方式。
王铁震表示,MaaS行业当前处于早期无序竞争格局,企业宁愿亏钱也愿意先销售服务、收获用户,所以当前的MaaS定价并不能完全反映实际成本。“国内所有行业都在卷。如果一个行业不卷,可能是因为大家都没有意识到这个行业有巨大潜力,卷起来之后就会凸显出谁才是这个行业真正的技术领先者。”在他看来,国内AI Infra行业还有巨大提升空间,“能看到未来这里面有巨大潜力,提高token输出速度,降低token价格,加速技术进步。”
3月11日,硅基流动宣布,DeepSeek API升级,DeepSeek-V3批量推理价格降低50%,3月11日-18日DeepSeek-R1批量推理价格降低75%,输入价格1元/百万Token、输出价格4元/百万Token。