Gemini 3.5 Flash：更贵，但谷歌计划将其用于一切

谷歌在I/O大会上发布了Gemini 3.5 Flash，直接进入通用可用阶段，并广泛应用于Gemini应用、AI模式搜索、开发者平台和企业产品。该模型价格显著上涨，是3 Flash Preview的3倍、3.1 Flash-Lite的6倍，接近3.1 Pro。谷歌还推出了新的Interactions API（测试版），类似OpenAI的Responses模式。尽管价格提升，谷歌仍将其用于大量免费消费者产品，表明三大AI实验室正在试探API客户的价格容忍度。

核心要点

Gemini 3.5 Flash直接通用可用，模型ID为gemini-3.5-flash，知识截止日期为2025年1月，支持1,048,576输入token和65,536最大输出token。
价格显著上涨：输入$1.50/百万token，输出$9/百万token，是3 Flash Preview的3倍、3.1 Flash-Lite的6倍，接近3.1 Pro（$2/$12）。
谷歌将其用于Gemini应用、AI模式搜索、Google Antigravity、Gemini API、Android Studio、Gemini Enterprise Agent Platform等产品。
新Interactions API（测试版）提供服务器端历史管理，类似OpenAI的Responses模式。
运行基准测试成本：3.5 Flash（高）为$1,551.60，高于3.1 Pro Preview的$892.28；其他厂商如Claude Opus 4.7（自适应推理）为$5,117.14。

正文

今天在谷歌I/O大会上，谷歌发布了Gemini 3.5 Flash。该模型跳过了预览版修饰符，直接进入通用可用阶段，谷歌似乎将其用于大量关键产品：

面向全球数十亿用户：通过Gemini应用和谷歌搜索中的AI模式。
面向开发者：在谷歌的智能体优先开发平台Google Antigravity、Gemini API（Google AI Studio和Android Studio中）。
面向企业：在Gemini Enterprise Agent Platform和Gemini Enterprise中。

与Gemini系列一贯风格相同，最有趣的细节隐藏在“Gemini 3.5 Flash新特性”开发者文档中。它大多具有与之前Gemini 3.x系列相同的平台功能，但没有计算机使用功能。模型ID为gemini-3.5-flash。知识截止日期为2025年1月，支持1,048,576输入token和65,536最大输出token。

谷歌还推出了新的Interactions API（目前处于测试版），在我看来，这类似于OpenAI的Responses模式引入的模式，特别是服务器端历史管理。

价格已上涨

Gemini 3.5 Flash伴随着显著的价格上涨。之前的“Flash”系列模型是Gemini 3 Flash Preview和Gemini 3.1 Flash-Lite。新的3.5 Flash价格是3 Flash Preview的3倍，是3.1 Flash-Lite的6倍（价格对比见此处）。

输入价格为$1.50/百万token，输出价格为$9/百万token，接近谷歌的Gemini 3.1 Pro（$2和$12）。

Gemini团队承诺3.5 Pro将在“下个月”推出——预计价格会更高。

这符合一个趋势：OpenAI的GPT-5.5价格是GPT-5.4的2倍，Claude Opus 4.7考虑到新分词器后，价格大约是4.6的1.46倍。

鉴于价格上涨，有趣的是谷歌将其用于如此多的免费消费者产品。感觉三大AI实验室都开始试探API客户的价格容忍度。

基准测试成本对比

Artificial Analysis发布了运行其专有基准测试的成本，这是一个有用的方式，可以考虑到分词化和推理token数量增加等因素。一些值得比较的数字：

Gemini 3.5 Flash（高）：$1,551.60
Gemini 3.1 Pro Preview：$892.28
Gemini 3 Flash Preview（推理）：$278.26
Gemini 3.1 Flash-Lite Preview：$93.60

运行3.5 Flash（高）的基准测试成本显著高于3.1 Pro Preview！

其他供应商的数字：

Claude Opus 4.7（自适应推理，最大努力）：$5,117.14
Claude Opus 4.7（非推理，高努力）：$1,217.23
GPT-5.5（极高）：$3,357.00
GPT-5.5（中等）：$1,199.14

自行车上的鹈鹕

我针对Gemini API运行了“生成一个骑自行车的鹈鹕的SVG”，得到了这只鹈鹕，它相当丰富：

从代码注释中：

Hacker News上的hedgehog评论：

那只鹈鹕看起来像是在迈阿密参加加密货币会议。

这花费了我11个输入token和14,403个输出token，总成本不到13美分。

标签：google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release

关联概念

Gemini 3.5 Flash
Google I/O
Interactions API
OpenAI Responses
LLM定价趋势
基准测试成本

原文: Gemini 3.5 Flash: more expensive, but Google plan to use it for everything
自动加工于 2026-05-20 11:31

核心要点

正文

价格已上涨

基准测试成本对比

自行车上的鹈鹕

关联概念

更多 AI·模型 文章

WorldKV：通过世界检索和压缩实现高效的世界记忆

你只需要最小的RLVR训练：通过秩1轨迹外推LLMs

π-Bench：评估主动个人助理代理在长视界工作流中的表现

HRM-Text：超越规模的高效预训练

更多 AI·模型文章