找到 2 篇包含 "VLA" 的文章

AI·模型 Hugging Face Daily Papers 2026-05-19

PhysBrain 1.0 技术报告

PhysBrain 1.0 技术报告提出利用人类自我中心视频生成物理常识监督信号,用于训练视觉-语言-动作模型,通过数据引擎提取场景元素、空间动态等关系,转化为问答监督训练 VLM,并迁移到 VLA 策略。