大模型“以厘计价”,谁能扛住价格战?

科技云报到

1

图源:摄图网

作者|科技云报道 来源|科技云报到(ID:ITCloud-BD)

最近一周,铺天盖地都是大模型降价的消息。

字节降完,智谱降;阿里降完,百度降;腾讯降完,科大讯飞降......是不是很像蹲萝卜的游戏?

事实上,国内有头有脸的大厂几乎都加入了这场游戏。接二连三地降价,让人一瞬间有了当年共享单车和云计算价格战的感觉。

互联网时代,所有人都习惯于大规模烧钱来获得最后的胜利。但AI时代,这套玩法还行得通吗?

国产大模型“以厘计价”

降价在商业世界里并不难理解,无非是“降价促销”、“以价换量”。

大模型领域的扛把子OpenAI就已经多次降价。

从去年3月OpenAI发布GPT4到现在,其产品从GPT4升级到GPT-4o,输入价格从0.03美元/千tokens下降到0.005美元/千tokens,降幅为83%;输出价格从0.06美元/千tokens下降到0.015美元/千tokens,降幅为75%。

但惊人的是,国内大模型比OpenAI更狠,直接把价格“打骨折”。

5月11日,智谱AI大模型的个人版GLM-3Turbo模型产品的调用价格从0.005元/千tokens降低至0.001元/千tokens,直降80%;GLM-3 Turbo Batch 批处理API也便宜了50%,价格仅为0.0005元/千tokens。

紧接着,5月15日,字节宣布豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens,较行业降幅达99.3%、95.8%,并声称已经击穿了大模型行业的最底价。

但“价格屠夫”还在后面。5月21日,阿里云通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千tokens,直降97%。

各大厂动不动就降价90%以上,已经是硝烟四起,然而还有更狠的角色——百度直接宣布文心Speed和文心Lite两款模型免费,开启了大模型API调用的“免费时代”。

5月22日,腾讯也按耐不住了,宣布主力模型之一的混元-lite 模型不仅从4k升级到256k,而且全面免费。

同日,科大讯飞首推永久免费大模型,讯飞星火API能力向全球用户开放。

有网友戏称,大模型正从“以分计价”的定价模式向“以厘计价”的时代迈进。

   价格战提前来临?

其实大模型降价并不稀奇,但稀奇的是商业化还没跑通,怎么价格战就先来了?

根据此前预期,大模型大致将按照每年50%-75%幅度降本,但现在大模型的降本速度远超预期。

答案很简单:加快商业化落地。

随着大模型参数越来越大,研发成本也越来越高。在巨大的成本压力下,大模型厂商不得不加紧寻找一条商业化之路。

根据无问芯穹发起人汪玉,用公开数据做了一次针对算力成本数量级的测算,假设GPT-4 Turbo每天要为10亿活跃用户提供服务,每年的算力成本可能超过两千亿,这还不包括模型训练的投入。

华为大模型负责人田奇曾提到,大模型开发和训练一次需要约1200万美元,这表明即使技术再领先的公司,大模型的训练也是非常昂贵的。

百川智能创始人CEO王小川也曾表示,每1亿参数对应训练成本在1.5到3万人民币之间。因此,一个千亿级参数的模型单次训练成本预估在3000万至5000万人民币之间。

显然,高昂的研发价格,已经成了AI商业化的枷锁。绝大部分公司的收入仍然还在亿的级别。以这种成本去打造商业闭环,显然是不成立的,而降价就成了最直接且最快速的落地方式。

同时,价格战能掀起的另一个因素是,大模型技术已经卷得差不多了。

外卖、快递、网约车、社区团购乃至新能源车等价格战火热的行业,或多或少都是由于同质化竞争而导致的,大模型也可能是当前卷性能带来的收益越来越低。

在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中,作者认为大模型在性能提升方面可能已达到收益递减的临界点。以OpenAI为例,从GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飞跃,但GPT-4到GPT-4 Turbo就没有那么多了。

如果大模型的性能发展真的要迎来一面墙,那么对于大模型公司来说,如何抢下用户是现阶段最重要的一步。

目前,国内大模型先头部队大多已接近GPT-4的能力,而这一能力已具备商业化的基础。经过一年多的技术比拼,大模型显然已经到了大规模市场验证的阶段。

因此,2024年大模型开始了从“卷技术”向“卷应用”的转变,商业化、落地应用成为大模型公司的主旋律,而降价将为大模型的应用落地带来了极大推动力。

    谁能扛住价格战?

虽然大家都在价格上卷起来了,但并不是所有企业都能加入价格战。

降价涉及到大模型的研发、训练、推理等一系列成本的优化,只有把大模型的研发成本尽可能的降低到最小,才有降价的空间和资本。

毋庸置疑,大厂是最扛打的一波。

在这轮价格战里,云厂商是最重要的发起方之一,先有字节的火山引擎,后来百度智能云、阿里云、腾讯云先后加入。

对云计算公司来说,大模型商业化能不能跑通,并不重要。更重要的是,如何依托于大模型新需求,打破过去云厂商的格局,重新建立自己的领先位置。

根据媒体报道,阿里云内部已经提出一个非常激进的目标,在三年之内,要占领国内大模型云计算市场的90%。这也是为什么阿里把国内5家大模型独角兽都投了一遍。

而火山引擎自2020年才对外提供服务开始,一直想以传统云计算模式去追赶大厂,始终没有太大起色。大模型出现改变了这一切。去年以来,它开始将字节跳动的AI能力作为突破口,试图打破旧有格局。这次降价也是这一逻辑下发生的。

事实上,基于大模型卖云服务并不是大厂唯一的商业模式。基于大模型重构应用,乃至打造大模型时代的超级应用,成为大厂在AI时代的新目标。

如果能够像互联网和移动互联网时代一样,诞生淘宝、微信这样的超级应用,大厂们又将迎来商业史上新的辉煌。

目前,百度已经完成了对百度文库、百度搜索、百度地图、如流等业务的AI重构。

阿里对钉钉、高德地图、闲鱼、饿了么、优酷、盒马、淘票票,天猫、淘宝等阿里集团最核心的产品进行了全面升级。

字节内部也开启了赛马机制,抖音、剪映等50多个业务线各自为营开始了AI探索。过去一年里,除了主打的豆包App外,基于豆包大模型,还推出了互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具。

腾讯则将混元大模型落地在超600个腾讯内部业务和场景中,包括企业微信、腾讯会议、腾讯文档等“一门三杰”产品,也包括腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品。

相比大厂的高举高打,大模型创业公司就显得不那么从容了。

百川智能创始人王小川表示,百川并不会“掺和”到价格战当中,原因在于,当前To B并不是百川的主要商业模式,价格战对其影响有限,百川更多的精力,还是会放在超级应用当中。

零一万物的李开复博士认为,目前零一万物带给的性能、性价比都很高了,不打算降低YI系列模型的API价格。“就像特斯拉,他不会因为别的牌子车比他卖得很便宜,他也要来降价。”

率先掀起价格战,喊着“不做应用做研究”的DeepSeek,也没有在各家大厂密集召开降价发布会时发声,显得无心参战。

无论创业系公司如何自圆其说,和财大气粗的大厂相比,一不小心都有可能震荡出局。

更大的挑战在于,国内大厂和大模型厂商基本都走模型+应用路线,推出各自的To C App,不少AI助手也已经开始大规模的市场投放。

不管是基础大模型的价格战,还是To C应用的用户争夺战,战火都已经烧起来了。

结语

无论从哪个角度看,把大模型拉入价格竞争,都不是一个明智的做法,也不一定会让大模型厂商迎来商业闭环。但现实是,这事就这样发生了。

既然大模型未来的发展谁都看不清,那就先降价把用户拿下来再说。这是移动互联网过去10年被证明过无数次的真理。

拿到用户,不管商业化能不能跑通,至少融资、并购后面还有的聊。但没有用户,你连上谈判桌的资管都没有。

在这种情况下,大模型厂商降低开发者成本,让更多开发者参与进来,帮助他们去触碰曾经触碰不到的用户,显然就是一条必经之路。

编者按:本文转载自微信公众号:科技云报到(ID:ITCloud-BD),作者:科技云报道 

可行性研究报告
科技云报到

本文作者信息

科技云报到(自媒体)

关注(33092)赞(2)

邀请演讲

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐