开发·工具

Simon Willison's Weblog 2026-05-21 1 min read ★ ★ ★ ☆ ☆

每秒10个token到底有多快？

阅读原文 ↗

本文通过一个HTML模拟器，直观展示LLM从每秒5到800个token的输出速度差异，帮助用户理解“30 tokens/second”等广告宣传的实际体验。

核心要点

Mike Veerman开发了一个HTML应用，模拟5至800 tokens/秒的LLM输出速度。
该工具可帮助用户直观感受不同token速率下的文本生成流畅度。
原文链接指向Hacker News讨论，标签包括ai、generative-ai、llms。
核心价值：将抽象的速度数字转化为可视化的实时体验。

正文

Mike Veerman开发了一个简洁的HTML应用（源代码在此），用于模拟LLM（大语言模型）在不同token输出速度下的文本生成效果。

该模拟器覆盖了从5 tokens/秒到800 tokens/秒的广泛速度范围。当你看到某个模型宣传“30 tokens/秒”时，可以通过这个工具直观地感受其实际生成速度，从而更准确地评估模型性能。

该工具通过Hacker News分享，并归类于ai、generative-ai、llms等标签下。

关联概念

LLM推理速度
token生成速率
模型性能评估

原文: How fast is 10 tokens per second really?
自动加工于 2026-05-21 08:10

#LLM #token速度 #用户体验