MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
AI·模型 Hugging Face Daily Papers 2026-05-21 1 min read ★ ★ ★ ★ ☆

生成式递归推理

阅读原文 ↗

GRAM将递归潜在推理转化为概率多轨迹计算,通过随机潜在轨迹支持多假设、并行推理和推理时扩展。该模型在结构化推理和多解约束满足任务上优于确定性基线,并具备无条件生成能力。


核心要点

  1. GRAM将递归推理从确定性单轨迹扩展为概率多轨迹计算,支持多个假设和并行推理。
  2. 通过随机潜在轨迹实现推理时扩展,可同时增加递归深度和并行轨迹采样。
  3. 模型支持条件推理 $p_θ(y|x)$ 和无条件生成 $p_θ(x)$,是一个潜变量生成模型。
  4. 采用摊销变分推理训练,在结构化推理和多解约束满足任务上优于确定性递归和循环基线。
  5. 展示了无条件生成能力,可生成新样本而无需输入条件。

正文

未来神经推理系统应如何实现扩展计算?递归推理模型(RRMs)通过使用共享转移函数进行迭代潜在状态精炼,为自回归序列扩展提供了一种有前景的替代方案。然而,现有的RRMs大多是确定性的,遵循单一潜在轨迹并收敛到单一预测。

我们引入了生成式递归推理模型(GRAM),这是一个将递归潜在推理转化为概率多轨迹计算的框架。GRAM将推理建模为随机潜在轨迹,从而支持多个假设、替代解决策略,并通过递归深度和并行轨迹采样实现推理时扩展。

这产生了一个潜变量生成模型,支持通过 $p_θ(y|x)$ 进行条件推理,以及在输入固定或缺失时通过 $p_θ(x)$ 进行无条件生成。通过摊销变分推理进行训练,GRAM在结构化推理和多解约束满足任务上优于确定性递归和循环基线,同时展示了无条件生成能力。


关联概念

  • 递归推理模型 (RRMs)
  • 摊销变分推理
  • 潜变量生成模型
  • 多轨迹计算
  • 推理时扩展

可操作项

可尝试在结构化推理任务(如约束满足问题)中应用GRAM,通过调整递归深度和并行轨迹数量来探索推理时扩展的效果。


原文: Generative Recursive Reasoning
自动加工于 2026-05-21 08:08

#递归推理#概率模型#多轨迹计算

更多 AI·模型 文章

AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

WorldKV:通过世界检索和压缩实现高效的世界记忆

WorldKV是一种无需训练的框架,通过世界检索和压缩技术,在保持视频扩散模型一致性的同时提高吞吐量。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

你只需要最小的RLVR训练:通过秩1轨迹外推LLMs

具有可验证奖励的参数轨迹表现出低秩结构,可以通过简单的线性回归方法进行有效外推,在减少计算需求的同时表现出卓越的性能。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

π-Bench:评估主动个人助理代理在长视界工作流中的表现

个人助理代理(如OpenClaw)的发展凸显了大型语言模型在支持用户日常生活和工作中的潜力。然而,现有基准测试很少评估代理在多轮交互中识别和响应隐含用户意图的能力。为此,本文引入了π-Bench,一个包含100个多轮任务和5个特定领域用户角色的基准测试,用于评估主动式个人助理代理。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-22 ★ ★ ☆ ☆ ☆

HRM-Text:超越规模的高效预训练

HRM-Text 是一种新型高效预训练方法,用分层循环模型(HRM)替代标准 Transformer,将计算解耦为慢速策略层和快速执行层。通过 MagicNorm 和预热深度信用分配稳定深度循环,并仅使用指令-响应对进行训练。1B 参数模型仅用 400 亿 token 和 1500 美元预算,在 M…

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA