2025年11月,这篇论文速读记录是如何的?

摘要:目录Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task PlanningMCCoder: Streamlining Motion Con
目录Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task PlanningMCCoder: Streamlining Motion Control with LLM-Assisted Code Generation and Rigorous VerificationLarge Language Model Enabled Industrial Document Generation Method Based on Retrieval Enhanced Prompt LearningSMAC-R1: The Emergence of Intelligence in Decision-Making TasksControlled Diversity with Preference: Towards Learning a Diverse Set of Desired SkillsHuman-Aligned Skill Discovery Balancing Behaviour Exploration and Alignment Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task Planning 来源:无端看到。CASE 2025 的 LLM 工作。 ieee xplore:https://ieeexplore.ieee.org/document/11164110 ieee xplore 论文集:CASE 2025,CASE 2024。 主要内容: 故事:传统机器人任务规划,依赖人工预定义规则库(如“积木可堆叠”),遇到新需求(如“按颜色堆叠”)需要重新编码,费时且不灵活。 先前方法的 gap:符号规划如 PDDL 的规则需人工编写,无法适应新属性。纯 LLM 方案生成计划易出现幻觉。混合方法也需固定规则库,无法动态扩展。 这篇文章 fill the gap:LLM 的灵活性 + 符号规划的可靠性,实现任务执行中实时扩展规则库(如动态添加“尺寸”“颜色”等属性)。 method:有一堆 agent:1. 领域生成器:将任务描述转为初始规则(如定义“堆叠”动作)。2. 初始状态生成器:生成对象初始属性(如“积木 B 是红色的”)。3. 目标生成器:解析目标,若缺属性(如“颜色”)则反向调用工具,要求上游智能体更新规则。4. 符号规划器:用规则库生成结构化计划。5. 自然语言翻译:将计划转成易懂指令(如“移动积木到位置 X”)。6. ReAct 执行器:结合环境反馈调整动作(遇失败则重试或报错)。 实验结果:做了一个叠积木的 benchmark,貌似只跟其他(没有搭载这个 agent 架构的)LLM 比较了,可能还做了一些 ablation。 MCCoder: Streamlining Motion Control with LLM-Assisted Code Generation and Rigorous Verification 来源:无端看到。CASE 2025 的 LLM 工作。 ieee xplore:https://ieeexplore.ieee.org/document/11163835 主要内容: 这篇文章关注的事情:工厂自动化中的运动控制代码生成。利用 LLM 自动生成高质量、安全可靠的运动控制代码,以替代目前主要依赖人工编程和调试的现状。 先前方法的问题:1. 传统方法手工编写,复杂性高、调试低效且不安全。2. 现有的 LLM 辅助编程,主要集中在 PLC(可编程逻辑控制器)等标准化语言上,很少关注 Python 或 C++ 等高级语言的运动控制库,并且对于生成代码的安全性、有效性,缺乏严格的验证机制。 这篇文章的 contribution:搭建了可以自动化写这种代码的 agent 结果,并且生成了专用数据集和评估指标。 method,包含多个 agent:任务分解模块 (Task Decomposition),混合检索模块 (Hybrid Retrieval),控制代码生成模块 (Control Code Generation),软运动模块 (Soft-Motion),自修正模块 (Self-Correction),数据验证模块 (Data Verification)。流程:用户输入任务 → 任务分解 → 混合检索 → 代码生成 → 软运动系统执行(仿真)→ 如果有错误,则自修正(回到代码生成)→ 如果无错误,则数据验证 → 最终部署或反馈。 实验结果:有真机。
阅读全文