谷歌在I/O大会上发布了Gemini 3.5 Flash,直接进入通用可用阶段,并广泛应用于Gemini应用、AI模式搜索、开发者平台和企业产品。该模型价格显著上涨,是3 Flash Preview的3倍、3.1 Flash-Lite的6倍,接近3.1 Pro。谷歌还推出了新的Interactions API(测试版),类似OpenAI的Responses模式。尽管价格提升,谷歌仍将其用于大量免费消费者产品,表明三大AI实验室正在试探API客户的价格容忍度。
核心要点
- Gemini 3.5 Flash直接通用可用,模型ID为gemini-3.5-flash,知识截止日期为2025年1月,支持1,048,576输入token和65,536最大输出token。
- 价格显著上涨:输入$1.50/百万token,输出$9/百万token,是3 Flash Preview的3倍、3.1 Flash-Lite的6倍,接近3.1 Pro($2/$12)。
- 谷歌将其用于Gemini应用、AI模式搜索、Google Antigravity、Gemini API、Android Studio、Gemini Enterprise Agent Platform等产品。
- 新Interactions API(测试版)提供服务器端历史管理,类似OpenAI的Responses模式。
- 运行基准测试成本:3.5 Flash(高)为$1,551.60,高于3.1 Pro Preview的$892.28;其他厂商如Claude Opus 4.7(自适应推理)为$5,117.14。
正文
今天在谷歌I/O大会上,谷歌发布了Gemini 3.5 Flash。该模型跳过了预览版修饰符,直接进入通用可用阶段,谷歌似乎将其用于大量关键产品:
- 面向全球数十亿用户:通过Gemini应用和谷歌搜索中的AI模式。
- 面向开发者:在谷歌的智能体优先开发平台Google Antigravity、Gemini API(Google AI Studio和Android Studio中)。
- 面向企业:在Gemini Enterprise Agent Platform和Gemini Enterprise中。
与Gemini系列一贯风格相同,最有趣的细节隐藏在“Gemini 3.5 Flash新特性”开发者文档中。它大多具有与之前Gemini 3.x系列相同的平台功能,但没有计算机使用功能。模型ID为gemini-3.5-flash。知识截止日期为2025年1月,支持1,048,576输入token和65,536最大输出token。
谷歌还推出了新的Interactions API(目前处于测试版),在我看来,这类似于OpenAI的Responses模式引入的模式,特别是服务器端历史管理。
价格已上涨
Gemini 3.5 Flash伴随着显著的价格上涨。之前的“Flash”系列模型是Gemini 3 Flash Preview和Gemini 3.1 Flash-Lite。新的3.5 Flash价格是3 Flash Preview的3倍,是3.1 Flash-Lite的6倍(价格对比见此处)。
输入价格为$1.50/百万token,输出价格为$9/百万token,接近谷歌的Gemini 3.1 Pro($2和$12)。
Gemini团队承诺3.5 Pro将在“下个月”推出——预计价格会更高。
这符合一个趋势:OpenAI的GPT-5.5价格是GPT-5.4的2倍,Claude Opus 4.7考虑到新分词器后,价格大约是4.6的1.46倍。
鉴于价格上涨,有趣的是谷歌将其用于如此多的免费消费者产品。感觉三大AI实验室都开始试探API客户的价格容忍度。
基准测试成本对比
Artificial Analysis发布了运行其专有基准测试的成本,这是一个有用的方式,可以考虑到分词化和推理token数量增加等因素。一些值得比较的数字:
- Gemini 3.5 Flash(高):$1,551.60
- Gemini 3.1 Pro Preview:$892.28
- Gemini 3 Flash Preview(推理):$278.26
- Gemini 3.1 Flash-Lite Preview:$93.60
运行3.5 Flash(高)的基准测试成本显著高于3.1 Pro Preview!
其他供应商的数字:
- Claude Opus 4.7(自适应推理,最大努力):$5,117.14
- Claude Opus 4.7(非推理,高努力):$1,217.23
- GPT-5.5(极高):$3,357.00
- GPT-5.5(中等):$1,199.14
自行车上的鹈鹕
我针对Gemini API运行了“生成一个骑自行车的鹈鹕的SVG”,得到了这只鹈鹕,它相当丰富:
从代码注释中:
Hacker News上的hedgehog评论:
那只鹈鹕看起来像是在迈阿密参加加密货币会议。
这花费了我11个输入token和14,403个输出token,总成本不到13美分。
标签:google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release
关联概念
- Gemini 3.5 Flash
- Google I/O
- Interactions API
- OpenAI Responses
- LLM定价趋势
- 基准测试成本
原文: Gemini 3.5 Flash: more expensive, but Google plan to use it for everything
自动加工于 2026-05-20 11:31