MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
开发·工具 Simon Willison's Weblog 2026-05-21 1 min read ★ ★ ★ ☆ ☆

每秒10个token到底有多快?

阅读原文 ↗

本文通过一个HTML模拟器,直观展示LLM从每秒5到800个token的输出速度差异,帮助用户理解“30 tokens/second”等广告宣传的实际体验。


核心要点

  1. Mike Veerman开发了一个HTML应用,模拟5至800 tokens/秒的LLM输出速度。
  2. 该工具可帮助用户直观感受不同token速率下的文本生成流畅度。
  3. 原文链接指向Hacker News讨论,标签包括ai、generative-ai、llms。
  4. 核心价值:将抽象的速度数字转化为可视化的实时体验。

正文

Mike Veerman开发了一个简洁的HTML应用(源代码在此),用于模拟LLM(大语言模型)在不同token输出速度下的文本生成效果。

该模拟器覆盖了从5 tokens/秒到800 tokens/秒的广泛速度范围。当你看到某个模型宣传“30 tokens/秒”时,可以通过这个工具直观地感受其实际生成速度,从而更准确地评估模型性能。

该工具通过Hacker News分享,并归类于ai、generative-ai、llms等标签下。


关联概念

  • LLM推理速度
  • token生成速率
  • 模型性能评估

原文: How fast is 10 tokens per second really?
自动加工于 2026-05-21 08:10

#LLM#token速度#用户体验

更多 开发·工具 文章

开发·工具 Hacker News 2026-05-23 ★ ★ ☆ ☆ ☆

蹄的血液泵送机制

本文介绍了蹄的血液泵送机制,解释了蹄在马匹血液循环中的重要作用。

阅读全文 →
↗
开发·工具 The Verge 2026-05-23 ★ ★ ☆ ☆ ☆

在东京最喜欢的虚拟咖啡店闲逛

找到一家适合自己的咖啡馆是一种令人振奋的体验。在现实中,作者有两家咖啡馆是他常去的地方,一家明亮通透且充满艺术气息,另一家兼营植物销售,让他周围绿意盎然。而在虚拟世界中,他也有一家“咖啡馆”可以放松。

阅读全文 →
↗
开发·工具 Hacker News 2026-05-22 ★ ★ ☆ ☆ ☆

作为陷阱的<noscript>元素

本文揭示了 `<noscript>` 元素可能被恶意利用为陷阱的风险。攻击者可通过在禁用 JavaScript 的浏览器中注入恶意内容,绕过安全检测或实施钓鱼攻击。文章分析了其工作原理、潜在危害及防御建议。

阅读全文 →
↗
开发·工具 Hacker News 2026-05-22 ★ ★ ☆ ☆ ☆

使用夹紧平行四边形的三角形镶嵌

本文介绍了一种基于钳位平行四边形的三角形细分方法,通过将三角形映射到平行四边形区域并施加钳位约束,实现高效且自适应的网格细分。该方法在保持几何特征的同时,避免了传统细分中的过度细分和裂缝问题,适用于实时渲染和几何处理。

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA