最近大模型圈是不是卷得太厉害了，有点过分了吗？

摘要：如果你这两天刷科技圈信息，可能会有一种感觉：刚看完一个模型更新，还没消化完，下一个又来了。除夕夜，本该是安安静静吃年夜饭的时间，大模型厂商却像打了鸡血一样—— 一个接一个更新，毫不客气。 “现在不是模型不够用，是我根本不知道该选哪个。”

如果你这两天刷科技圈信息，可能会有一种感觉：刚看完一个模型更新，还没消化完，下一个又来了。除夕夜，本该是安安静静吃年夜饭的时间，大模型厂商却像打了鸡血一样—— 一个接一个更新，毫不客气。 “现在不是模型不够用，是我根本不知道该选哪个。” 一、先说个容易被忽略，但很关键的变化最近 DeepSeek 的 APP 更新了版本，表面看是一次“小升级”，但其实很不简单。两个变化，值得单独拎出来说：第一，上下文直接拉到 100 万 Token。这是什么概念？以前你跟 AI 聊天，它像个短期记忆不好的人，聊多了就“忘前文”；现在相当于你一次性把完整代码库、项目文档、甚至一本书丢给它，它还能从头看到尾。这不是“更大数字”的问题，而是使用方式彻底变了。第二，知识库时间线更新到 2025 年 5 月。这几乎可以确定一件事：背后已经不是老模型微调，而是新一代模型在路上了。之前传闻说春节前后会有动作，现在基本算是实锤预热。二、除夕夜最狠的一刀，来自阿里如果说 DeepSeek 是“悄悄换了发动机”，那阿里这波就是直接“换了车”。除夕当天，阿里发布了新一代模型：千问 Qwen3.5-Plus。很多人第一反应是： “又升级？我已经麻了。” 但这次不太一样。几个点你只要记住一句话就够：用不到一半的参数量，干翻了自家万亿级模型。更夸张的是：原生多模态（文字、图片、理解一起上）推理吞吐最高提升 19 倍 API 价格低到离谱：百万 Token 只要几毛钱说实话，这已经不是“技术炫技”，而是赤裸裸的工程和成本碾压。现在很多团队，包括我们身边的一些真实项目，已经在用阿里云百炼的 API 把它接进生产系统。不是因为情怀，是因为真省钱、真能跑。三、国外这边也没闲着，Claude 继续加码你以为国内卷完就结束了？紧接着，Anthropic 发布了 Claude Sonnet 4.6。这次更新没有新概念，也没有夸张营销，但很“工程师向”：同样支持 100 万 Token 推理更稳，不爱胡编，也不瞎设计电脑操作能力明显提升，复杂表格、多页面任务能一口气做完关键是：价格没涨现在你打开 claude.ai，免费用户用的就是新版本， Cursor、GitHub、Replit 这些工具也已经全部接入。一句话总结：它不是最便宜的，但是最“省心”的那一档。四、所以问题来了：普通人到底该怎么选？你预算充足、追求最稳的编程和推理体验 👉 Claude Opus / Sonnet 系列你想让 AI 自己跑任务、做 Agent、长流程执行 👉 智谱 GLM-5 这种偏工程化的模型更合适你想省钱，但又不想牺牲能力，尤其是多模态 👉 千问 Qwen3.5-Plus 是目前性价比最狠的选项之一现在的现实是：已经不存在“唯一最强模型”了。谁更适合你的场景，谁就是最好的。五、最后说句掏心窝子的这一波更新，看着像“模型内卷”，但对用户来说，其实是红利期。上下文越来越大成本越来越低能力越来越接近真实“干活助手” 真正难的，反而不是模型不够强，而是—— 你有没有想清楚，要用它来干什么。模型会继续卷，但会用的人，已经开始悄悄拉开差距了。

最近大模型圈是不是卷得太厉害了，有点过分了吗？

相关推荐