【谷歌更新Gemini API定价，按推理使用分档计费】

谷歌近日对旗下AI模型的收费结构做了一次“体检”，并推出了一套更灵活的新方案。新的API计费档位包括五个类别：标准版、弹性版、优先版、批量版和缓存版。

其中“弹性推理”档位挺有意思，它有点像错峰出行——利用非高峰时段的闲置算力来提供服务，价格是标准版本的一半，不过响应时间可能在1到15分钟之间，且没有延迟保证，适合那些对时效要求不那么高的场景。

“批量API”档位同样享受半价优惠，它更“从容”，允许任务排队处理，最长延迟可达24小时，适合大规模、非紧急的数据处理。

新增的“缓存版”则按缓存的数据量和存储时间计费。这个设计很适合那些需要反复调用相同信息的应用，比如搭载复杂系统指令的对话机器人、需要对长视频文件进行多次分析，或是处理大规模文档库的查询任务。

而“优先档位”走的是VIP通道，价格也比标准版高出不少，涨幅在75%到100%之间。它能将响应时间控制在毫秒到秒级，谷歌推荐将其用于实时在线客服、欺诈检测或其它对响应速度要求极高的核心业务场景。

总的来看，这次调整让开发者可以根据自己对速度、成本和场景的需求，更精细地选择合适档位。#大厂科技动态#