2025年11月，这篇论文速读记录是如何的？

目录Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task PlanningMCCoder: Streamlining Motion Control with LLM-Assisted Code Generation and Rigorous VerificationLarge Language Model Enabled Industrial Document Generation Method Based on Retrieval Enhanced Prompt LearningSMAC-R1: The Emergence of Intelligence in Decision-Making TasksControlled Diversity with Preference: Towards Learning a Diverse Set of Desired SkillsHuman-Aligned Skill Discovery Balancing Behaviour Exploration and Alignment Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task Planning 来源：无端看到。CASE 2025 的 LLM 工作。 ieee xplore：https://ieeexplore.ieee.org/document/11164110 ieee xplore 论文集：CASE 2025，CASE 2024。主要内容：故事：传统机器人任务规划，依赖人工预定义规则库（如“积木可堆叠”），遇到新需求（如“按颜色堆叠”）需要重新编码，费时且不灵活。先前方法的 gap：符号规划如 PDDL 的规则需人工编写，无法适应新属性。纯 LLM 方案生成计划易出现幻觉。混合方法也需固定规则库，无法动态扩展。这篇文章 fill the gap：LLM 的灵活性 + 符号规划的可靠性，实现任务执行中实时扩展规则库（如动态添加“尺寸”“颜色”等属性）。 method：有一堆 agent：1. 领域生成器：将任务描述转为初始规则（如定义“堆叠”动作）。2. 初始状态生成器：生成对象初始属性（如“积木 B 是红色的”）。3. 目标生成器：解析目标，若缺属性（如“颜色”）则反向调用工具，要求上游智能体更新规则。4. 符号规划器：用规则库生成结构化计划。5. 自然语言翻译：将计划转成易懂指令（如“移动积木到位置 X”）。6. ReAct 执行器：结合环境反馈调整动作（遇失败则重试或报错）。实验结果：做了一个叠积木的 benchmark，貌似只跟其他（没有搭载这个 agent 架构的）LLM 比较了，可能还做了一些 ablation。 MCCoder: Streamlining Motion Control with LLM-Assisted Code Generation and Rigorous Verification 来源：无端看到。CASE 2025 的 LLM 工作。 ieee xplore：https://ieeexplore.ieee.org/document/11163835 主要内容：这篇文章关注的事情：工厂自动化中的运动控制代码生成。利用 LLM 自动生成高质量、安全可靠的运动控制代码，以替代目前主要依赖人工编程和调试的现状。先前方法的问题：1. 传统方法手工编写，复杂性高、调试低效且不安全。2. 现有的 LLM 辅助编程，主要集中在 PLC（可编程逻辑控制器）等标准化语言上，很少关注 Python 或 C++ 等高级语言的运动控制库，并且对于生成代码的安全性、有效性，缺乏严格的验证机制。这篇文章的 contribution：搭建了可以自动化写这种代码的 agent 结果，并且生成了专用数据集和评估指标。 method，包含多个 agent：任务分解模块 (Task Decomposition)，混合检索模块 (Hybrid Retrieval)，控制代码生成模块 (Control Code Generation)，软运动模块 (Soft-Motion)，自修正模块 (Self-Correction)，数据验证模块 (Data Verification）。流程：用户输入任务 → 任务分解 → 混合检索 → 代码生成 → 软运动系统执行（仿真）→ 如果有错误，则自修正（回到代码生成）→ 如果无错误，则数据验证 → 最终部署或反馈。实验结果：有真机。

2025年11月，这篇论文速读记录是如何的？

相关推荐