【谷歌更新Gemini API定价,按推理使用分档计费】

谷歌近日对旗下AI模型的收费结构做了一次“体检”,并推出了一套更灵活的新方案。新的API计费档位包括五个类别:标准版、弹性版、优先版、批量版和缓存版。

其中“弹性推理”档位挺有意思,它有点像错峰出行——利用非高峰时段的闲置算力来提供服务,价格是标准版本的一半,不过响应时间可能在1到15分钟之间,且没有延迟保证,适合那些对时效要求不那么高的场景。

“批量API”档位同样享受半价优惠,它更“从容”,允许任务排队处理,最长延迟可达24小时,适合大规模、非紧急的数据处理。

新增的“缓存版”则按缓存的数据量和存储时间计费。这个设计很适合那些需要反复调用相同信息的应用,比如搭载复杂系统指令的对话机器人、需要对长视频文件进行多次分析,或是处理大规模文档库的查询任务。

而“优先档位”走的是VIP通道,价格也比标准版高出不少,涨幅在75%到100%之间。它能将响应时间控制在毫秒到秒级,谷歌推荐将其用于实时在线客服、欺诈检测或其它对响应速度要求极高的核心业务场景。

总的来看,这次调整让开发者可以根据自己对速度、成本和场景的需求,更精细地选择合适档位。#大厂科技动态#

Previous:

Next: