第587章大模型价格战卷至“厘时代”！阿里云通义千问降价97％（1 / 2）

近日，阿里云宣布推出通义千问gpt-4级主力模型qwen-long，其api输入价格从002元/千tokens降至00005元/千tokens，直降97。这意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。此消息一出，立即引发了业界的广泛关注和热议。

值得一提的是，本月智谱ai、字节跳动的大模型也都纷纷宣布降价。其中，字节的豆包主力模型的定价为00008元/千tokens，即08厘/千tokens，被认为带动大模型定价进入了“厘时代”。

此轮大模型降价潮，是各家厂商希望进一步抢占市场，从而加速ai应用的商业化落地。

9款商业化及开源系列模型降价

qwen-long是通义千问的长文本增强版模型，性能对标gpt-4，上下文长度最高1千万。除了输入价格降至00005元/千tokens，qwen-long输出价格也降90至0002元/千tokens。相比之下，国内外厂商gpt-4、i15 pro、cude 3 n及ernie-40每千tokens输入价格分别为022元、0025元、0022元及012元。

通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型qwen-ax，api输入价格降至004元/千tokens，降幅为67％。

智谱ai、字节跳动旗下火山引擎也纷纷宣布了降价

5月11日，智谱ai大模型的新注册用户获得额度从500万tokens提升至2500万tokens，个人版 gl-3turbo模型产品的调用价格从5元/百万tokens降低至1元/百万tokens。gl-3 turbo batch 批处理api也便宜了50，价格为1元/200万tokens。

15日，火山引擎宣布豆包pro 32k模型定价是08厘/千tokens。此外，豆包pro 128k模型定价是5厘钱/千tokens。

大模型已经开始从“卷大模型技术”向“卷大模型应用”转变

对于此轮降价潮，不少业内分析指出，大模型已经开始从“卷大模型技术”向“卷大模型应用”转变，但推理成本过高依然是制约大模型规模化应用的关键因素。

在武汉ai智领者峰会现场，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称：“阿里云这次大幅降低大模型推理价格，就是希望加速ai应用的爆发。我们预计2024年大模型api的日调用次数有望突破100亿。”

刘伟光判断，不管是开源模型还是商业化模型，公共云+api将成为企业使用大模型的主流方式。云上调用成本远对于私有云部署。在追求更大尺寸的模型时，企业要面对gpu采购、软件部署、网络费用、电费、人力成本等等。随着大模型的规模变大，对于私有化部署的成本和复杂性会越来越高。去年还有不少企业考虑购买上百台gpu服务器，来搭建计算网络集群。但今年很多公司已经放弃了自建百台集群的大模型研发。

百度创始人李彦宏也在业绩会表示，模型推理是最重要的长期机会之一，这将成为云业务的关键驱动力。4月，文心大模型api日调用量为2亿次。去年12月时，该数据为5000万次。

谁能抢抓模型推理的市场机遇？

谈及通义千问的这次降价幅度，多名大模型行业专家在接受《科创板日报》记者采访时评价，“力度很大”、“很便宜了”。

不过，实际作用还是要看“疗效”。市面上大模型太多了。疗效好，多少都不贵；如果疗效不好，多少都是贵。

书香世家

第587章 大模型价格战卷至“厘时代”！阿里云通义千问降价97％（1 / 2）

第587章大模型价格战卷至“厘时代”！阿里云通义千问降价97％（1 / 2）