5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。
该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。
注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。
为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(Prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。
谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。
与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。
谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。
该内容转自IT之家
本文共 351 个字数,平均阅读时长 ≈ 1分钟
喜欢就支持一下吧
本站为个人博客,博客所发布的一切破解补丁、注册机和注册信息及软件的文章仅限用于学习和研究目的。
不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。
本站信息来自网络,版权争议与本站无关,您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容。
访问和下载本站内容,说明您已同意上述条款。
本站不贩卖软件,所有内容不作为商业行为。如果有侵犯您的权益请点击“关于”联系WFXL,核实后会及时删除
版权属于:新闻发布
作品采用《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权
评论 抢沙发