专题:大模型
共120篇相关文章

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:ICLR'24 (2) 背景 现有 benchmarks 已经饱和,无法捕获最先进的语言模型和无法做到的前沿,需要具有挑战性的新 benchmark 来更准确的反映语言模型的现实应用 工作 (1)...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:ISSTA'24 (2) 背景 软件工程涉及程序改进的过程,特别是软件维护(例如,程序错误修复)和软件演变(例如,功能添加) 自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:Arxiv 06.12 (2) 挑战 主要探讨了基于 LLM 的 APR 的两个主要类别:代理和程序。尽管这两个范式都表现出希望,但它们依然表现出两个重要的局限性: 忽视历史修复经验:现有方法都忽略了从同一存储库中先前解...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:NIPS'24 (2) 背景 考虑直接与 Linux 终端直接互动的 Agent 的简单设置,我们发现 LM Agent 很难在这种环境下可靠地采取行动。例如,它无法提供简单的命令来编辑一个小文件...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:FSE'25 (2) 挑战 现有工作都在探索基于 Agent 的方式来解决软件问题,但人与当前 LLM 能力之间的差异会导致基于 Agent 的方法的以下局限性: 复杂的工具使用设计:当前基于...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:EMNLP'25 (2) 背景 高级 LLM 的正确翻译率较低,导致不同类型的执行错误。本文认为此问题的根本原因是 LLM 的预训练任务和代码翻译任务要求之间的差异。与自然语言不通,编程语言具有其...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,我将尽力帮助您。
介绍 (1) 发表:BuildingTrust'25 (2) 背景 尽管对多智能体 LLM 系统(MAS)的热情越来越多,但与单机准则框架相比,它们在流行的基准测试中的性能往往仍然很少。这一差距强调了系统地分析阻碍...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:Arxiv 09.03 (2) 背景 查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10% 尽管现有工作已经作出了初步尝...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:ICSE'25 (2) 背景 之前的研究表明,与传统的代码摘要模型相比,LLM 生成的摘要在表达方式上与参考摘要有很大不同,并且倾向于描述更多的细节。因此,传统的评估方法是否适合评估 LLM 生成...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:ICSE'25 (2) 背景 最近的一些工作研究了基于 LLM 的提交信息生成,然而目前尚不清楚 LLM 通过 ICL 在该领域的表现如何 (3) 贡献 本文对通过 ICL 使用 LLM 进行提交...

很抱歉,您提供的信息不完整,我无法直接给出答案。请您提供更具体的问题或信息,这样我才能更好地帮助您。
介绍 (1) 发表:EMNLP'24 (2) 背景 现有方法通常存在一些缺点,例如只关注变化的行是不够的,或者在变化周围包含不相关的行会带来噪声。如图 1 所示,添加和删除的代码实际上是相同的,只是位置不同,导致代码...

监督微调(SFT)在应用中如何实现?
SFT 简介 (1) 什么是监督微调 监督微调(SFT)通过利用特定于任务的标签数据集将预训练的 LLM 适应特定任务。SFT 的数据集通常组织如下,一条样本包含一个指令和对应的回答:(D={(I_K,A_K)}_{K=1}^N)...

如何利用大模型构建企业AI业务,实现高效转型?
Hello, 大家好,我是程序员海军, 全栈开发 |AI爱好者 | 独立开发。 记录第一次在公司内部分享AI+业务 落...

Langchain 1.0之后,astream_events事件类型及其生命周期是怎样的?
本文为博客园用户“孤舟晓月”原创,发布于博客园,备份与B站。若你在其他站点看到,说明它被盗了...... 前置知识 langchain使用流式输出通常采用stream(同步)和astream(异步)两种模式,类似与下面的代码段: print...
![[db:标题]](/view/img/nopic.png)
[db:标题]
AiReader :一个内置 AI 的桌面阅读器,所有 AI 推理都在你本地的 CPUGPU 上运行。
不需要联网,不需要注册,不需要 API Key。安装后首次配置下载一个 AI 模型(几百 MB 到几 GB),之后拔掉...
