专题:llm
共160篇相关文章

语义保护型上下文压缩技术如何实现AI Agent无限续航?
Solon AI框架的SummarizationInterceptor创新性地解决了AI长对话中的'上下文窗口爆炸'问题。这套智能记忆管理系统通过四步策略:锁定核心任务指令、确保行动-结果完整性、保持语义...

Solon AI v3.9.4 发布,支持Java8到Java25,有适合我的智能体开发框架吗?
Solon AI 是一个面向Java开发者的全栈智能体应用开发框架,具有以下特点: 跨模型兼容:支持OpenAI、DeepSeek等多种大模型,提供统一接口 全链路RAG支持:涵盖文档加载、向量化到检索重排全流程 多智能体协作:支持ReAc...

SolonCode v0.0.18发布,终端智能助手(编码智能体)有哪些新功能?
SolonCode 是由杭州无耳科技有限公司,基于 Java 8 + Solon AI 开发的 **“Claude Code” 国产开源实现版本**。它不仅是一个 **AI 终端智能助手**(帮你查资料、写报告、发邮件,生...

20分钟内能否从零基础训练出‘有手就行’的大模型?
一、说在前面 训练基座大模型那都是大公司们的事情,普通人、普通公司肯定是玩不起的,但是作为一个技术人,你可以不去做真正的大模型训练,但是你还是有必要知道和了解一下一个大模型是如何训练出来的。 而GPT_teacher-3.37M-cn 是一...

如何用个人数据微调大模型,使其更懂我?
在现在这个时代,完全可以说,大部分的技术都是没有什么价值的,因为大部分的技术都是有手就行。真正的价值都在数据,而且最有价值的数据往往都是一个个的专业领域的数据,决定大模型微调效果的是数据,决定你整个产品成败的也是数据,这个事情一定要搞清楚。...

LLM通常指的是大型语言模型(Large Language Model),这是一种基于深度学习技术构建的模型,能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构,从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
这个 repo 总结了 LLM agents play games 的论文,最近读了一些。 论文列表: Plan4MC: Skill Reinforcement Learning and Planning for Open-World Mi...

LLM通常指的是大型语言模型(Large Language Model),这是一种基于深度学习技术构建的模型,能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构,从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
这篇文章使用 LLM 生成了各种 MineCraft 的 skill,但没有利用 LLM 的通识能力,感觉不算 LLM agent 的工作。...

LLM通常指的是大型语言模型(Large Language Model),这是一种基于深度学习技术构建的模型,能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构,从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
感觉性能好的关键原因:1. prompt 写得好,可以高效沟通;2. agent 记忆的信息形式很简洁。...

LLM通常指的是大型语言模型(Large Language Model),这是一种基于深度学习技术构建的模型,能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构,从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
论文标题:Large Language Models Play StarCraft II: Benchmarks and A Chain of Summarization Approach 最初发表时间:2023.12 arxiv:http...

LLM通常指的是大型语言模型(Large Language Model),这是一种基于深度学习技术构建的模型,能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构,从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
Avalon's Game of Thoughts: Battle Against Deception through Recursive Contemplation 论文标题:Avalon'...

LLM多轮任务中,RAGEN、ArCHer、GiGPO、VinePPO如何微调?
最近读了一些 LLM 的 multi-turn RL 文章,写博客记录一下。 正在看的 GitHub 参考 repo:https:github.comyubol-boboAwesome-Multi-Turn-LLMs 目录前置知识:...

LLM | ARC-AGI:哪个有趣的benchmark能挑战极限?
ARC-AGI benchmark 提供了基于视觉网格的谜题,它们是“对于人类简单、对于大模型困难”的问题。...

LLM | 正在尝试使用 LLaMA-Factory,是?
正在看的博客:知乎 | LLaMA-Factory QuickStart 好像是作者写的博客:知乎 | 单卡 3 小时训练专属大模型 Agent:基于 LLaMA Factory 实战 其他博客: 知乎 | LLaMA-Factory 全参...

正在尝试用verlLLM,有何高见?
主要参考资料: verl 的 GitHub:https:github.comvolcengineverl verl 的文档:verl documentation 安装 verl:verl documentation | Instal...

LLM与REINFORCE结合,近期新方法是啥?
REINFORCE++ 把 GRPO“prompt 小组内归一化优势”升级为“全局 batch 上标准化优势”,并搭配稳定的 KL 估计方式,比 PPO 轻量级,比 GRPO 稳定和泛化性强。...
