继文心大模型4.0 Turbo(ERNIE 4.0 Turbo)在WAVE SUMMIT深度学习开发者大会2024上正式发布后,在近日举行的2024世界人工智能大会(WAIC)上,百度方面宣布面向企业客户全面开放,同时文心旗舰款模型ERNIE 4.0和ERNIE 3.5等也迎来了大幅降价。
具体而言,ERNIE 4.0 Turbo的输入输出价格分别为0.03元/千Tokens、0.06元/千Tokens。对此百度副总裁谢广军表示,“按照3:1输入输出长短统计下,(ERNIE 4.0 Turbo)相较于ERNIE 4.0通用版本的降价幅度达70%”。
公开资料显示,ERNIE 4.0 Turbo发布于6月28日,其上下文输入长度从4.0版的2K tokens升级到128K tokens,能够同时阅读100个文件或网址,AI生图分辨率也从512×512提升至1024×1024。与ERNIE 4.0的生成效果对比,在相同的提示词下,其生成速度明显更快,生成内容也更具条理性。
此外,ERNIE 3.5-8K、ERNIE 3.5-128K、ERNIE4.0-8K等模型也均迎来降价,其中ERNIE 3.5-8K、ERNIE 3.5-128K的输入也降至以0.004元/千token和0.008元/千token,可帮助客户降低大模型使用门槛和试错成本。
而ERNIE Speed和ERNIE Lite两款模型则将继续免费,其中ERNIE Speed是百度自研的高性能大语言模型,适合作为基座模型进行精调。ERNIE Lite则是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。在今年5月免费开放前,ERNIE Lite输入价格为0.003元/千token、输出价格为0.006元/千token,ERNIE Speed输入价格为0.004元/千token、输出价格是0.008元/千token。
值得的一提的是,在百度方面调整大模型价格之前,包括智谱AI、字节跳动、阿里云在内的国内AI企业也相继下调了大模型的费用。例如字节跳动在5月15日发布自研豆包大模型时宣布,其主力模型在企业市场的定价为0.0008元/千tokens,号称“比行业便宜99.3%”。
随后阿里云方面宣布通义千问9款商业化、开源模型降价,其中主力模型Qwen-Long API输入价格由0.02元/千tokens降至 0.0005元/千tokens、降幅达97%,输出价格由0.02元/千tokens降至0.002元/千tokens、降幅达90%。而在腾讯方面,除混元-lite全面免费开放,并将API输入输出总长度计划级到256K之外,混元-standard-256K的输入价格降至0.015元/千tokens、降幅达87.5%,输出价格也降至0.06元/千tokens、降幅达50%,混元-pro的输入价格更是降至0.03元/千tokens、降幅达70%。
字节跳动旗下火山引擎总裁谭待此前曾表示,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素,大模型“卷”价格将助力企业以更低成本加速业务创新。百度智能云市场部总经理曹海涛对此则认为,目前国内有200多个规模级以上的大模型,因此价格战至少还将持续一年,这在短期内是好事,可以先淘汰“鱼龙混杂”的厂商、让有能力的厂商活下来,并占有一定的市场份额。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 文心一言用户规模已达7000万,覆盖场景4300个
- 百度文心一言正式全面开放,百度智能云将同步升级千帆大模型平台
未经允许不得转载:头条今日_全国热点资讯网(头条才是今日你关心的) » 百度文心大模型4.0 Turbo向企业开放,价格更低