llm

欢迎访问ZJ新闻社SEO

专题：llm

共160篇相关文章

语义保护型上下文压缩技术如何实现AI Agent无限续航？
Solon AI框架的SummarizationInterceptor创新性地解决了AI长对话中的'上下文窗口爆炸'问题。这套智能记忆管理系统通过四步策略：锁定核心任务指令、确保行动-结果完整性、保持语义...
1月前2阅读
Solon AI v3.9.4 发布，支持Java8到Java25，有适合我的智能体开发框架吗？
Solon AI 是一个面向Java开发者的全栈智能体应用开发框架，具有以下特点：跨模型兼容：支持OpenAI、DeepSeek等多种大模型，提供统一接口全链路RAG支持：涵盖文档加载、向量化到检索重排全流程多智能体协作：支持ReAc...
1月前2阅读
SolonCode v0.0.18发布，终端智能助手（编码智能体）有哪些新功能？
SolonCode 是由杭州无耳科技有限公司，基于 Java 8 + Solon AI 开发的 **“Claude Code” 国产开源实现版本**。它不仅是一个 **AI 终端智能助手**（帮你查资料、写报告、发邮件，生...
1月前3阅读
20分钟内能否从零基础训练出‘有手就行’的大模型？
一、说在前面训练基座大模型那都是大公司们的事情，普通人、普通公司肯定是玩不起的，但是作为一个技术人，你可以不去做真正的大模型训练，但是你还是有必要知道和了解一下一个大模型是如何训练出来的。而GPT_teacher-3.37M-cn 是一...
1月前2阅读
如何用个人数据微调大模型，使其更懂我？
在现在这个时代，完全可以说，大部分的技术都是没有什么价值的，因为大部分的技术都是有手就行。真正的价值都在数据，而且最有价值的数据往往都是一个个的专业领域的数据，决定大模型微调效果的是数据，决定你整个产品成败的也是数据，这个事情一定要搞清楚。...
1月前4阅读
LLM通常指的是大型语言模型（Large Language Model），这是一种基于深度学习技术构建的模型，能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构，从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
这个 repo 总结了 LLM agents play games 的论文，最近读了一些。论文列表： Plan4MC: Skill Reinforcement Learning and Planning for Open-World Mi...
1月前3阅读
LLM通常指的是大型语言模型（Large Language Model），这是一种基于深度学习技术构建的模型，能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构，从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
这篇文章使用 LLM 生成了各种 MineCraft 的 skill，但没有利用 LLM 的通识能力，感觉不算 LLM agent 的工作。...
1月前5阅读
LLM通常指的是大型语言模型（Large Language Model），这是一种基于深度学习技术构建的模型，能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构，从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
感觉性能好的关键原因：1. prompt 写得好，可以高效沟通；2. agent 记忆的信息形式很简洁。...
1月前3阅读
LLM通常指的是大型语言模型（Large Language Model），这是一种基于深度学习技术构建的模型，能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构，从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
论文标题：Large Language Models Play StarCraft II: Benchmarks and A Chain of Summarization Approach 最初发表时间：2023.12 arxiv：http...
1月前3阅读
LLM通常指的是大型语言模型（Large Language Model），这是一种基于深度学习技术构建的模型，能够理解和生成人类语言。LLM通过分析大量的文本数据来学习语言的规律和结构，从而能够进行文本生成、机器翻译、情感分析等多种任务。如果您需要关于LL
Avalon&#39;s Game of Thoughts: Battle Against Deception through Recursive Contemplation 论文标题：Avalon&#39;...
1月前3阅读
LLM多轮任务中，RAGEN、ArCHer、GiGPO、VinePPO如何微调？
最近读了一些 LLM 的 multi-turn RL 文章，写博客记录一下。正在看的 GitHub 参考 repo：https:github.comyubol-boboAwesome-Multi-Turn-LLMs 目录前置知识：...
1月前3阅读
LLM | ARC-AGI：哪个有趣的benchmark能挑战极限？
ARC-AGI benchmark 提供了基于视觉网格的谜题，它们是“对于人类简单、对于大模型困难”的问题。...
1月前3阅读
LLM | 正在尝试使用 LLaMA-Factory，是？
正在看的博客：知乎 | LLaMA-Factory QuickStart 好像是作者写的博客：知乎 | 单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战其他博客：知乎 | LLaMA-Factory 全参...
1月前3阅读
正在尝试用verlLLM，有何高见？
主要参考资料： verl 的 GitHub：https:github.comvolcengineverl verl 的文档：verl documentation 安装 verl：verl documentation | Instal...
1月前3阅读
LLM与REINFORCE结合，近期新方法是啥？
REINFORCE++ 把 GRPO“prompt 小组内归一化优势”升级为“全局 batch 上标准化优势”，并搭配稳定的 KL 估计方式，比 PPO 轻量级，比 GRPO 稳定和泛化性强。...
1月前3阅读