锻造
Forge是一个为自托管LLM工具调用设计的可靠性层,通过护栏和上下文管理,将8B本地模型提升至多步代理工作流的顶级水平。
20+ 篇文章
Forge是一个为自托管LLM工具调用设计的可靠性层,通过护栏和上下文管理,将8B本地模型提升至多步代理工作流的顶级水平。
谷歌在I/O 2026上宣布AI Studio新增原生Android应用创建功能,用户通过自然语言描述即可在几分钟内生成应用,使用Kotlin和Jetpack Compose。
Vercel实验室推出实验性编程语言Zero,专为AI智能体设计,强调可学习性和结构化工具暴露,目前处于预发布阶段。
谷歌在IO 2026上推出Antigravity 2.0,新增桌面应用、CLI工具和SDK,支持多代理编排、并行任务执行等功能,并与Google AI Studio等集成。
本文作者批判了当前流行的“氛围编程”(Vibe Coding)现象,认为依赖AI自动生成代码而不理解原理会导致代码质量下降、维护困难,并削弱程序员的核心能力。
谷歌发布Android CLI 1.0稳定版,允许AI智能体直接调用Android Studio工具,加速Android应用开发。
Mozilla 宣布 Asm.js 已完成历史使命,WebAssembly 成为更优的替代方案,建议开发者迁移。
whichllm 是一个 Python 工具,能自动检测硬件配置并从 HuggingFace 获取模型数据,智能推荐最适合本地运行的大语言模型。
本文介绍了Transformer模型中自回归下一个词预测的基本原理,并重点解释了KV缓存技术如何通过存储先前计算的键值对来加速推理过程,减少重复计算,提升生成效率。
本文探讨了利用AI代理(如大型语言模型)测试分布式系统的方法,通过模拟交互、生成场景和自动分析结果来提高测试覆盖率和效率,并介绍了在故障注入、一致性验证和性能测试中的应用。
ECC 是一个开源的 AI 智能体工具链原生算子系统,源自 Anthropic 黑客马拉松获奖项目,提供技能、记忆优化、持续学习等能力,支持多种开发工具。
Hocuspocus 4 是一个自托管的 Yjs 协作后端,提供实时协作编辑功能,支持多人同时编辑文档、代码等。它基于 Yjs 协议,可集成多种前端编辑器,适用于需要自建协作系统的场景。
本文探讨了C语言中未定义行为(UB)的普遍性,指出许多常见操作都可能触发UB,并提醒开发者注意避免依赖特定编译器行为。
本文探讨了代码托管平台碎片化带来的协作困难、工具链不兼容和迁移成本高等挑战,并提出了标准化协议、统一API和跨平台工具等缓解策略。
本文探讨了“每秒 N 个 Token”这一指标的实际含义,通过对比人类阅读速度等常见场景,量化了 Token 速率对交互流畅度的影响,并给出了不同应用场景下的推荐速率范围。
llm-gemini 0.32 版本发布,新增对 Gemini 3.5 Flash 模型的支持。
GuJumpgate 是一个基于 FlowPilot 二次开发的 Chrome 扩展,支持全自动注册和激活 GPT Plus 账号,包括自动注册、PayPal 支付、邮箱别名等功能。
9arm-skills 是一个为 Claude Code 设计的智能体技能集合,按类别组织并提供安装脚本,帮助开发者扩展 AI 编码助手的功能。
llm-gemini 0.32a0 版本发布,兼容 llm>=0.32a0 alpha,新增流式推理令牌功能。
一个基于WebSocket的实时聊天应用,无需注册即可通过房间ID和用户名加入聊天,支持房间管理、实时消息广播和用户列表显示。