2023-2026年间，有哪些可以描述LLM Agent综述论文？

摘要：LLM Agent 综述论文文献综述 (2023-2026) 概述本文献综述整理了近3年（2023-2026）关于大型语言模型(LLM) Agent的重要综述论文和相关研究工作。随着大语言模型能力的快速发展，LLM Agent已成为实现通

LLM Agent 综述论文文献综述 (2023-2026) 概述本文献综述整理了近3年（2023-2026）关于大型语言模型(LLM) Agent的重要综述论文和相关研究工作。随着大语言模型能力的快速发展，LLM Agent已成为实现通用人工智能(AI)的关键研究方向之一。一、核心综述论文 1. "SoK: Agentic Skills -- Beyond Tool Use in LLM Agents" (2026年2月) 作者： Yanna Jiang, Delong Li, Haiyu Deng, Baihe Ma, Xu Wang, Qin Wang, Guangsheng Yu 研究焦点：系统性地探讨了Agent技能(Agentic Skills)的概念，超越简单的工具使用提出了可重用过程能力的框架将Agent技能定义为可调用的模块，封装了过程知识与明确的适用性条件、执行策略和终止标准主要贡献：建立了Agentic Skills的分类体系分析了技能的可复用性、组合性和可扩展性探讨了从单体语言模型到模块化、技能配备Agent的转变应用场景：长期工作流的可靠执行多Agent协作中的技能共享 Agent能力的模块化设计 2. "Memory for Autonomous LLM Agents: Mechanisms, Evaluation, and Emerging Frontiers" (2026年3月) 研究焦点：自主Agent的记忆机制评估方法与新兴前沿主要维度：记忆类型：短期记忆、长期记忆、情景记忆、语义记忆存储机制：向量数据库、图谱存储、层次结构检索策略：相关性检索、时序检索、重要性加权评估方法：记忆准确性、检索效率、知识更新能力关键挑战：记忆遗忘问题幻觉现象记忆一致性维护大规模记忆的效率优化 3. "Cognitive Models and AI Algorithms Provide Templates for Designing Language Agents" (2026年2月) 作者： Ryan Liu, Dilip Arumugam, Cedegao E. Zhang, Sean Escola, Xaq Pitkow, Thomas L. Griffiths 研究焦点：认知模型与AI算法为语言Agent设计提供模板探讨单一大语言模型无法解决的复杂问题核心观点：借鉴人类认知科学理论指导Agent设计认知模型（如工作记忆、元认知、认知启发式）为Agent架构提供理论基础多Agent协作超越单个模型的限制设计范式：认知分层架构（工作记忆— episodic记忆— 语义记忆）元认知能力（监控、规划、反思）认知启发式策略 4. "The Five Ws of Multi-Agent Communication: Who Talks to Whom, When, What, and Why -- A Survey from MARL to Emergent Language and LLMs" (2026年2月) 作者： Jingdi Chen, Hanqing Yang, Zongjun Liu, Carlee Joe-Wong 研究焦点：多Agent系统中的通信机制从多智能体强化学习(MARL)到涌现语言和LLMs 核心框架： Who talks to whom: 通信拓扑结构（中心化、去中心化、混合式） When: 通信触发条件（按需、周期性、事件驱动） What: 通信内容（状态、策略、目标、意图） Why: 通信目的（协调、协作、竞争、学习）研究领域交叉： MARL中的通信学习涌现语言(如ALife) LLM驱动的对话式通信应用领域：自动驾驶车队机器人集群协作AI助手分布式决策系统 5. "Toward Personalized LLM-Powered Agents: Foundations, Evaluation, and Future Directions" (2026年2月) 作者： Yue Xu, Qian Chen, Zizhan Ma, Dongrui Liu, Wenxuan Wang, Xiting Wang, Li Xiong, Wenjie Wang 研究焦点：个性化Agent的基础框架评估方法与未来方向关键维度：个性化来源：用户偏好、历史行为、上下文、领域知识建模方法：提示工程、微调、检索增强生成(RAG) 评估指标：准确性、一致性、满意度、伦理合规性挑战与方向：跨场景的个性化迁移隐私保护与个性化权衡动态偏好建模个性化效果的量化评估 6. "Graph-based Agent Memory: Taxonomy, Techniques, and Applications" (2026年2月) 研究焦点：基于图谱的Agent记忆系统分类法、技术和应用关键技术：图谱类型：知识图谱、关系图谱、时序图谱、层次图谱构建方法：实体提取、关系抽取、图嵌入查询操作：图遍历、子图匹配、图推理应用场景：问答系统、推荐系统、决策支持优势：结构化知识表示关系推理能力可解释性提升知识共享与复用 7. "Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations" (2026年2月) 研究焦点： Agent记忆的解剖学与分类评估与系统局限性的实证分析记忆分类体系：感知记忆（Sensory Memory）工作记忆（Working Memory）长期记忆：情景记忆、语义记忆、程序记忆元记忆系统局限性：容量限制检索延迟上下文窗口约束幻觉与错误传播二、应用领域综述 8. "Agentic AI in Healthcare & Medicine: A Seven-Dimensional Taxonomy for Empirical Evaluation of LLM-based Agents" (2026年2月) 作者： Shubham Vatsal, Harsh Dubey, Aditi Singh 研究焦点：医疗健康领域的Agent AI 七维评估分类体系评估维度：临床准确性可解释性公平性与偏见隐私与安全效率与可扩展性人机协作性伦理合规性应用场景：诊断辅助治疗方案推荐患者监护药物研发医疗咨询 9. "From Secure Agentic AI to Secure Agentic Web: Challenges, Threats, and Future Directions" (2026年3月) 作者： Zhihang Deng, Jiaping Gui, Weinan Zhang 研究焦点： Agent安全与Agentic Web安全挑战、威胁与未来方向安全威胁分类：提示注入攻击(Prompt Injection) 供应链攻击(Supply Chain) 数据泄露(Data Exfiltration) 对抗性攻击(Adversarial Attacks) 权限提升(Privilege Escalation) 防御策略：输入验证与沙箱权限最小化审计日志安全框架与标准可验证Agent 10. "From Perception to Action: Spatial AI Agents and World Models" (2026年2月) 作者： Gloria Felicia, Nolan Bryant, Handi Putra, Ayaan Gazali, Eliel Lobo, Esteban Rojas 研究焦点：空间智能Agent与世界模型从感知到行动的跨越关键能力： 3D结构感知对象关系推理物理约束下的行动空间记忆与映射挑战：符号域与物理域的鸿沟空间不确定性建模实时感知与决策跨模态融合三、技术与机制相关研究 11. "Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward" (2026年2月) 作者： Renjun Xu, Yang Yan 研究焦点： LLM Agent技能的架构、获取、安全性及发展路径核心内容：从单体模型到模块化Agent的转变技能的表示与封装技能获取：人工指定、强化学习、模仿学习、自动发现安全性考虑：技能篡改检测、执行沙箱、权限控制 12. "ValueFlow: Measuring the Propagation of Value Perturbations in Multi-Agent LLM Systems" (2026年2月) 研究焦点：多Agent系统中价值扰动的传播测量核心概念：价值流(Value Flow)：价值观在Agent网络中的传播路径价值扰动(Value Perturbation)：价值观的偏差与放大一致性测量：多Agent价值观的对齐程度四、评估与验证研究 13. "SurveyLens: A Research Discipline-Aware Benchmark for Automatic Survey Generation" (2026年2月) 作者： Beichen Guo, Zhiyuan Wen, Jia Gu, Senzhang Wang, Haochen Shi, Ruosong Yang, Shuaiqi Liu 研究焦点：自动综述生成的基准测试研究领域感知技术演进：从简单流水线到多Agent协作领域知识增强质量评估指标 14. "Assessing the Reliability of Persona-Conditioned LLMs as Synthetic Survey Respondents" (2026年2月) 作者： Erika Elizabeth Taday Morocho, Lorenzo Cima, Tiziano Fagni, Marco Avvenuti, Stefano Cresci 研究焦点：评估Persona条件化LLM作为合成调查受访者的可靠性研究方法：将LLM生成的合成调查数据与人类调查数据进行对比评估偏差、一致性和代表性问题 15. "Stochastic Parrots or Singing in Harmony? Testing Five Leading LLMs for their Ability to Replicate a Human Survey with Synthetic Data" (2026年2月) 作者： Jason Miklian, Kristian Hoelscher, John E. Katsos 研究焦点：测试五大LLM复现人类调查的能力合成数据的质量与可靠性五、研究趋势总结主要发展趋势模块化与技能化从单体模型向模块化Agent转变技能的封装、复用与组合成为核心关注点记忆系统架构记忆机制作为Agent的核心模块多层次、多类型记忆的协同设计图谱化、结构化记忆的兴起多Agent协作通信机制与协议设计协作策略与冲突解决分布式智能与涌现行为个性化与定制化用户偏好建模与适应个性化Agent的学习与更新域知识注入与融合安全性与可靠性 Agent安全威胁识别防御机制与框架可验证与可审计Agent 跨领域应用医疗、教育、金融等垂直领域领域特定评估体系场景化Agent设计技术挑战上下文管理长期记忆与高效检索上下文窗口限制信息遗忘与更新幻觉与一致性 Agent生成的幻觉问题多轮对话的一致性维护知识准确性的保证评估体系统一评估框架的缺乏主观质量的量化真实场景的模拟可解释性 Agent决策的透明化推理过程的可追溯用户信任的建立效率与可扩展性计算成本控制大规模Agent部署资源优化与调度未来研究方向认知架构演进更深度的认知科学借鉴元认知能力的增强自主学习与适应人机协作深化共享意图与协同决策人类反馈的整合信任校准与透明化标准化与规范 Agent标准与协议伦理框架与治理行业规范与最佳实践新范式探索神经符号融合脑机接口集成生物启发的Agent设计六、结论近3年的LLM Agent研究呈现出蓬勃发展的态势，从单一模型能力扩展到多Agent系统、记忆机制、技能封装、个性化定制等多个维度。研究者们不仅关注Agent的能力提升，越来越重视其可靠性、安全性、可解释性和道德合规性。未来的研究将进一步向认知结构深化、人机协作优化、标准化推进和新范式探索等方向发展。随着技术的成熟和应用场景的拓展，LLM Agent有望在更多领域实现广泛应用，成为连接大语言模型与实际应用的关键桥梁。整理时间： 2026年3月10日文献来源： arXiv、Google Scholar、ACL等学术数据库关键词： LLM Agent, Survey, Review, Multi-Agent System, Memory Mechanism, Agentic Skills X 参考文献

2023-2026年间，有哪些可以描述LLM Agent综述论文？

相关推荐