MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
AI·模型 Simon Willison's Weblog 2026-05-20 1 min read ★ ★ ★ ★ ☆

Gemini 3.5 Flash:更贵,但谷歌计划将其用于一切

阅读原文 ↗

谷歌在I/O大会上发布了Gemini 3.5 Flash,直接进入通用可用阶段,并广泛应用于Gemini应用、AI模式搜索、开发者平台和企业产品。该模型价格显著上涨,是3 Flash Preview的3倍、3.1 Flash-Lite的6倍,接近3.1 Pro。谷歌还推出了新的Interactions API(测试版),类似OpenAI的Responses模式。尽管价格提升,谷歌仍将其用于大量免费消费者产品,表明三大AI实验室正在试探API客户的价格容忍度。


核心要点

  1. Gemini 3.5 Flash直接通用可用,模型ID为gemini-3.5-flash,知识截止日期为2025年1月,支持1,048,576输入token和65,536最大输出token。
  2. 价格显著上涨:输入$1.50/百万token,输出$9/百万token,是3 Flash Preview的3倍、3.1 Flash-Lite的6倍,接近3.1 Pro($2/$12)。
  3. 谷歌将其用于Gemini应用、AI模式搜索、Google Antigravity、Gemini API、Android Studio、Gemini Enterprise Agent Platform等产品。
  4. 新Interactions API(测试版)提供服务器端历史管理,类似OpenAI的Responses模式。
  5. 运行基准测试成本:3.5 Flash(高)为$1,551.60,高于3.1 Pro Preview的$892.28;其他厂商如Claude Opus 4.7(自适应推理)为$5,117.14。

正文

今天在谷歌I/O大会上,谷歌发布了Gemini 3.5 Flash。该模型跳过了预览版修饰符,直接进入通用可用阶段,谷歌似乎将其用于大量关键产品:

  • 面向全球数十亿用户:通过Gemini应用和谷歌搜索中的AI模式。
  • 面向开发者:在谷歌的智能体优先开发平台Google Antigravity、Gemini API(Google AI Studio和Android Studio中)。
  • 面向企业:在Gemini Enterprise Agent Platform和Gemini Enterprise中。

与Gemini系列一贯风格相同,最有趣的细节隐藏在“Gemini 3.5 Flash新特性”开发者文档中。它大多具有与之前Gemini 3.x系列相同的平台功能,但没有计算机使用功能。模型ID为gemini-3.5-flash。知识截止日期为2025年1月,支持1,048,576输入token和65,536最大输出token。

谷歌还推出了新的Interactions API(目前处于测试版),在我看来,这类似于OpenAI的Responses模式引入的模式,特别是服务器端历史管理。

价格已上涨

Gemini 3.5 Flash伴随着显著的价格上涨。之前的“Flash”系列模型是Gemini 3 Flash Preview和Gemini 3.1 Flash-Lite。新的3.5 Flash价格是3 Flash Preview的3倍,是3.1 Flash-Lite的6倍(价格对比见此处)。

输入价格为$1.50/百万token,输出价格为$9/百万token,接近谷歌的Gemini 3.1 Pro($2和$12)。

Gemini团队承诺3.5 Pro将在“下个月”推出——预计价格会更高。

这符合一个趋势:OpenAI的GPT-5.5价格是GPT-5.4的2倍,Claude Opus 4.7考虑到新分词器后,价格大约是4.6的1.46倍。

鉴于价格上涨,有趣的是谷歌将其用于如此多的免费消费者产品。感觉三大AI实验室都开始试探API客户的价格容忍度。

基准测试成本对比

Artificial Analysis发布了运行其专有基准测试的成本,这是一个有用的方式,可以考虑到分词化和推理token数量增加等因素。一些值得比较的数字:

  • Gemini 3.5 Flash(高):$1,551.60
  • Gemini 3.1 Pro Preview:$892.28
  • Gemini 3 Flash Preview(推理):$278.26
  • Gemini 3.1 Flash-Lite Preview:$93.60

运行3.5 Flash(高)的基准测试成本显著高于3.1 Pro Preview!

其他供应商的数字:

  • Claude Opus 4.7(自适应推理,最大努力):$5,117.14
  • Claude Opus 4.7(非推理,高努力):$1,217.23
  • GPT-5.5(极高):$3,357.00
  • GPT-5.5(中等):$1,199.14

自行车上的鹈鹕

我针对Gemini API运行了“生成一个骑自行车的鹈鹕的SVG”,得到了这只鹈鹕,它相当丰富:

从代码注释中:

Hacker News上的hedgehog评论:

那只鹈鹕看起来像是在迈阿密参加加密货币会议。

这花费了我11个输入token和14,403个输出token,总成本不到13美分。

标签:google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release


关联概念

  • Gemini 3.5 Flash
  • Google I/O
  • Interactions API
  • OpenAI Responses
  • LLM定价趋势
  • 基准测试成本

原文: Gemini 3.5 Flash: more expensive, but Google plan to use it for everything
自动加工于 2026-05-20 11:31

#Gemini#谷歌#AI模型#定价

更多 AI·模型 文章

AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

WorldKV:通过世界检索和压缩实现高效的世界记忆

WorldKV是一种无需训练的框架,通过世界检索和压缩技术,在保持视频扩散模型一致性的同时提高吞吐量。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

你只需要最小的RLVR训练:通过秩1轨迹外推LLMs

具有可验证奖励的参数轨迹表现出低秩结构,可以通过简单的线性回归方法进行有效外推,在减少计算需求的同时表现出卓越的性能。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

π-Bench:评估主动个人助理代理在长视界工作流中的表现

个人助理代理(如OpenClaw)的发展凸显了大型语言模型在支持用户日常生活和工作中的潜力。然而,现有基准测试很少评估代理在多轮交互中识别和响应隐含用户意图的能力。为此,本文引入了π-Bench,一个包含100个多轮任务和5个特定领域用户角色的基准测试,用于评估主动式个人助理代理。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-22 ★ ★ ☆ ☆ ☆

HRM-Text:超越规模的高效预训练

HRM-Text 是一种新型高效预训练方法,用分层循环模型(HRM)替代标准 Transformer,将计算解耦为慢速策略层和快速执行层。通过 MagicNorm 和预热深度信用分配稳定深度循环,并仅使用指令-响应对进行训练。1B 参数模型仅用 400 亿 token 和 1500 美元预算,在 M…

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA