RL | AIR-DREAM Lab 最新论文提出了哪些生成新方法?
摘要:一直对这个组的方向很感兴趣,于是速读一下这个组的最新文章。 (这篇笔记仅存档自用。以下论文完全是速读,没有进行任何精读,记录的笔记全都是 给我输入文章摘要 + 框图之后,我输出出来的幻觉,没有什么参考价值;还可能有少量 d
一直对这个组的方向很感兴趣,于是速读一下这个组的最新文章。
(这篇笔记仅存档自用。以下论文完全是速读,没有进行任何精读,记录的笔记全都是 给我输入文章摘要 + 框图之后,我输出出来的幻觉,没有什么参考价值;还可能有少量 deepseek 速读)
AIR-DREAM Lab 主页:https://air-dream.netlify.app/
Efficient Robotic Policy Learning via Latent Space Backward Planning - 通过 latent space 的 backward planning 实现机器人策略高效学习
信息:2025.05,ICML 2025,https://air-dream.netlify.app/publication/liu-2025-lbp/
理解:是 robotics 的工作,我不懂这种工作。latent 里的递归 planning,感觉有趣。粗看跟这个挺像的:HIQL: Offline Goal-Conditioned RL with Latent States as Action(arxiv),但这篇我也还没读。
现有的 robot 做事情需要 planning,一般是做 model-based planning,其中 state 通常是 pixel-based 的高清图像。然而,这种 pixel-based 世界模型计算成本大,还会有 accumulation errors,导致 planning 不准确,影响性能。
有一些方法会用粗粒度(coarse-grained)subgoals 来 planning,但好像仍然有问题,这一句没看懂。
这篇文章提出了 a Backward Planning scheme in Latent space(LBP),从 latent space 里 planning。先把最终目标搞到 latent 里,然后在 latent space 里递归地预测 更接近我们当前 state 的 subgoal。
Universal Actions for Enhanced Embodied Foundation Models - 为 enhanced 的具身 foundation model 而打造的 universal actions
信息:2025.02,CVPR 2025,https://air-dream.netlify.app/publication/zheng-2025-universal/
理解:具身的工作,没看懂,不了解。
Diffusion-Based Planning for Autonomous Driving with Flexible Guidance - 为自动驾驶设计的、带有柔性引导的基于 diffusion 的 planning
信息:2025.01,ICLR 2025 oral,https://air-dream.netlify.app/publication/zheng-2025-diffusion/
理解:diffusion + transformer 工作,我不懂 diffusion,不太了解。这篇工作做了真实世界的自动驾驶。
Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning - 通过单模态学习实现机器人多模态任务 specification
信息:2025.01,ICRA 2025,https://air-dream.netlify.app/publication/li-2025-robo/
理解:我其实也不太懂多模态。感觉 representation learning 有趣,之前还看过 cross-embodiment 的 representation 对齐的工作(XSkill,arxiv),不过那个对齐的是轨迹的 embedding。
这篇文章希望可以只用一种模态(比如图片 / 文字指令)来训练,测试时使用另一种模态来告诉 agent 它要执行的任务。
这篇文章首先用大量 out-of-domain 数据进行 pretrain(我也不懂 out-of-domain 是什么),训一个 DecisionNCE 来让同一任务的图片 / 文字指令的 embedding 的余弦相似度高。
然后,采用两个不用训练的 Collapse 和 Corrupt 操作,进一步缩小多模态 representation 中模态之间的 gap。
