专题:x1F341 论文速读
共20篇相关文章

2025年2月修改的论文速读记录是关于什么主题的?
目录SEABO: A Simple Search-Based Method for Offline Imitation LearningTraining Agents using Upside-Down Reinforcement Lear...

2025年3月修改的论文速读记录是关于什么主题的?
目录Enhancing Autonomous Vehicle Training with Language Model Integration and Critical Scenario Generation Enhancing Auton...

2025年4月修改的论文速读记录是关于什么主题的?
目录Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement LearningOpen-World Reinforcement...

2025年5月修改的论文速读记录,有哪些疑问点?
目录Mixing corrupted preferences for robust and feedback-efficient preference-based reinforcement learningXSkill: Cross Em...

2025年6月修改的论文速读记录,有哪些疑问点?
目录Contrastive learning as goal-conditioned reinforcement learning (Contrastive RL NCE)C-Learning: Learning to Achieve Go...

RL | AIR-DREAM Lab 最新论文提出了哪些生成新方法?
一直对这个组的方向很感兴趣,于是速读一下这个组的最新文章。 (这篇笔记仅存档自用。以下论文完全是速读,没有进行任何精读,记录的笔记全都是 给我输入文章摘要 + 框图之后,我输出出来的幻觉,没有什么参考价值;还可能有少量 d...

2025年7月修改的论文速读记录,有哪些疑问点?
目录Wasserstein Dependency Measure for Representation Learning Wasserstein Dependency Measure for Representation Learning...

2025年8月修改的论文速读记录,有哪些疑问点?
目录Guiding Pretraining in Reinforcement Learning with Large Language Models Guiding Pretraining in Reinforcement Learning...

2025年9月修改的论文速读记录,有哪些疑问点?
目录SkiLD: Unsupervised Skill Discovery Guided by Factor Interactions一、背景与动机:传统 USD 的困境二、核心概念:因子化与交互的定义三、SkiLD 算法流程:分层学习与交...

2025年10月,这篇论文速读记录是如何的?
目录Efficient Skill Discovery via Regret-Aware Optimization1 故事2 method3 相关思考Seohong Park 的两篇博客:Q-learning is not yet scal...

RL | 速读 IJCAI 2025 的强化学习论文,有哪些可以挖掘?
论文列表 359 Multi-granularity Knowledge Transfer for Continual Reinforcement Learning - 为持续 RL 而设计的多粒度知识迁移 769 BILE: An Eff...

2025年11月,这篇论文速读记录是如何的?
目录Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task PlanningMCCoder: Streamlining Motion Con...

2025年12月第一篇论文速读记录是关于什么主题的?
目录Offline Multitask Representation Learning for Reinforcement Learning1000 Layer Networks for Self-Supervised RL: Scalin...

如何通过经典论文速读记录,掌握offline meta-RL的知识?
目录(MAML) Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks [ICML 2017](MACAW) Offline Meta-Reinforcement...

近期有哪些关于offline meta-RL的工作进展值得速读?
目录📌 近期工作 1(UBER) Unsupervised Behavior Extraction via Random Intent Priors [NeurIPS 2023]Meta-DT: Offlin...
