MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
AI·模型 Hugging Face Daily Papers 2026-05-19 1 min read ★ ★ ★ ★ ☆

大规模多智能体路径规划中的局部通信学习

阅读原文 ↗

本文提出了一种名为LC-MAPF的预训练模型,通过引入可学习的局部通信模块,使相邻智能体之间进行多轮特征共享,从而提升多智能体路径规划中的协调能力。实验表明,该方法在多种未见过的测试场景中,在多个指标上均优于现有的基于强化学习和模仿学习的求解器,且不牺牲可扩展性。


核心要点

  1. 多智能体路径规划(MAPF)是NP-hard问题,但可扩展的求解器对物流、搜救等实际应用至关重要。
  2. 现有方法将MAPF建模为Dec-POMDP,每个智能体基于局部观测通过强化学习或模仿学习决策。
  3. 本文提出LC-MAPF,引入可学习的局部通信模块,支持相邻智能体间多轮信息交换以增强协调。
  4. 实验表明LC-MAPF在多种未见测试场景中,在成功率、路径长度等指标上优于现有IL和RL方法。
  5. 通信机制不损害可扩展性,这是通信型MAPF求解器的常见瓶颈。

正文

多智能体路径规划(MAPF)是多机器人轨迹规划问题的一种广泛使用的抽象,其中多个同质智能体在共享环境中同时移动。尽管最优求解MAPF是NP-hard的,但可扩展且高效的求解器对于物流、搜救等实际应用至关重要。为此,研究社区提出了多种利用机器学习的分散式次优MAPF求解器。这些方法将MAPF(从单个智能体视角)建模为Dec-POMDP,每个时间步智能体需基于局部观测决定动作,通常通过强化学习或模仿学习求解。本文遵循相同思路,但额外引入了一个可学习的通信模块,通过高效的特征共享增强智能体间的协作。我们提出了局部通信多智能体路径规划(LC-MAPF),这是一个可泛化的预训练模型,在相邻智能体之间应用多轮通信以交换信息并改善协调。实验表明,所提方法在多种(未见过的)测试场景中,在多个指标上均优于现有的基于学习的MAPF求解器,包括IL和RL方法。值得注意的是,所引入的通信机制并未损害LC-MAPF的可扩展性,而这是通信型MAPF求解器的常见瓶颈。


关联概念

  • 多智能体路径规划 (MAPF)
  • Dec-POMDP
  • 强化学习
  • 模仿学习
  • 多轮通信
  • 特征共享
  • 预训练模型

可操作项

可尝试复现LC-MAPF模型,在公开MAPF基准数据集(如MovingAI的仓库场景)上测试其性能,并与现有学习型求解器(如PRIMAL、DHC)进行对比。


原文: Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding
自动加工于 2026-05-19 05:53

#多智能体路径规划#局部通信#预训练模型

更多 AI·模型 文章

精选
AI·模型 TechCrunch 2026-05-20 ★ ★ ★ ★ ☆

谷歌推出Gemini 3.5 Flash:押注AI代理而非聊天机器人

谷歌在I/O大会上发布Gemini 3.5 Flash,主打自主AI代理能力,在编码、代理任务和多模态推理上超越前代旗舰模型,速度提升4倍。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-20 ★ ★ ★ ★ ☆

CompactAttention:通过块联合KV选择加速分块预填充

CompactAttention是一种针对长上下文大语言模型分块预填充阶段的高效注意力机制,通过块联合KV选择将二维块稀疏掩码转换为GQA感知的每分组KV块表,在分页执行约束下实现加速。

阅读全文 →
↗
精选
AI·模型 Hugging Face Daily Papers 2026-05-20 ★ ★ ★ ★ ☆

Lance:通过多任务协同实现统一多模态建模

Lance 是一个轻量级原生统一模型,通过协作多任务训练实现图像和视频的多模态理解、生成与编辑,不依赖模型规模扩展或文本-图像主导设计。其核心采用双流混合专家架构,在共享交错多模态序列上训练,实现联合上下文学习。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-20 ★ ★ ★ ★ ☆

AstraFlow:面向数据流的智能体大语言模型强化学习系统

AstraFlow 是一种面向数据流的强化学习系统,专为智能体大语言模型设计,通过解耦部署、数据流和训练组件,支持多策略协作训练与弹性扩展。

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA