MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
AI·模型 Hugging Face Daily Papers 2026-05-19 1 min read ★ ★ ★ ★ ☆

DexJoCo:面向MuJoCo的任务导向灵巧操作基准与工具包

阅读原文 ↗

DexJoCo提出了一个灵巧操作基准与工具包,包含11个功能性任务,评估工具使用、双手协调、长时执行和推理能力。它提供了一个低成本数据采集系统,收集了1.1K条轨迹,并支持域随机化以评估鲁棒性。通过视觉和动力学随机化、多任务训练和动作头适应等设置,对现代模型进行了基准测试,揭示了当前策略的常见局限和关键挑战。


核心要点

  1. 包含11个功能性任务,评估工具使用、双手协调、长时执行和推理。
  2. 开发了低成本数据采集系统,收集了1.1K条轨迹。
  3. 支持域随机化(视觉和动力学随机化)以评估鲁棒性。
  4. 对现代模型进行了多任务训练和动作头适应等设置下的基准测试。
  5. 通过实证分析识别了当前灵巧操作策略的常见局限和关键挑战。

正文

原始摘要

实现人类水平的操作需要能够进行复杂物体交互的灵巧机器人手。进一步推进这种能力需要标准化的基准进行系统评估。然而,现有的灵巧基准缺乏反映灵巧手相对于平行夹爪的独特操作能力的任务,也缺乏全面的评估流程。在本文中,我们提出了DexJoCo,一个面向任务导向灵巧操作的基准和工具包,包含11个功能性任务,评估工具使用、双手协调、长时执行和推理。我们开发了一个低成本数据采集系统,并在这些任务中收集了1.1K条轨迹,支持域随机化以评估鲁棒性。我们在多种设置下对现代模型进行了基准测试,包括视觉和动力学随机化、多任务训练和动作头适应。通过广泛的实证分析,我们识别了当前灵巧操作策略的几个重要见解和常见局限,突出了灵巧手机器人学习未来研究的关键挑战。项目页面:https://dexjoco.github.io


关联概念

  • 灵巧操作
  • 基准测试
  • 域随机化
  • 多任务学习
  • MuJoCo

可操作项

访问项目页面 https://dexjoco.github.io 和代码仓库 https://github.com/brave-eai/dexjoco,下载工具包并尝试运行11个任务中的示例,使用低成本数据采集系统收集自己的轨迹,并应用域随机化进行鲁棒性测试。


原文: DexJoCo: A Benchmark and Toolkit for Task-Oriented Dexterous Manipulation on MuJoCo
自动加工于 2026-05-19 05:52

#灵巧操作#基准测试#MuJoCo#机器人

更多 AI·模型 文章

AI·模型 Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆

Flash-GRPO:通过单步策略优化实现视频扩散的高效对齐

Flash-GRPO 是一种单步训练框架,通过等时分组和时间梯度修正,在低计算预算下实现视频扩散模型的高效对齐,显著提升训练效率。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆

赫尔德策略优化

赫尔德策略优化(HölderPO)提出一种通用框架,通过Hölder均值统一token级概率聚合,解决了GRPO中固定聚合机制导致的训练崩溃与性能权衡问题,在多个数学基准上平均准确率达54.9%。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆

InsightTok:在自回归图像生成的离散分词中提升文本与面部保真度

InsightTok 是一种改进的离散视觉标记化框架,通过引入内容感知的感知损失,显著提升了文本和面部的重建质量,并有效迁移至自回归图像生成任务。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆

大规模多智能体路径规划中的局部通信学习

本文提出LC-MAPF预训练模型,通过可学习的局部通信模块实现相邻智能体多轮特征共享,提升多智能体路径规划协调能力。实验在多种未见场景中优于现有强化学习和模仿学习方法,且保持可扩展性。

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA