最近大模型圈是不是卷得太厉害了,有点过分了吗?

摘要:如果你这两天刷科技圈信息,可能会有一种感觉: 刚看完一个模型更新,还没消化完,下一个又来了。 除夕夜,本该是安安静静吃年夜饭的时间,大模型厂商却像打了鸡血一样—— 一个接一个更新,毫不客气。 “现在不是模型不够用,是我根本不知道该选哪个。”
如果你这两天刷科技圈信息,可能会有一种感觉: 刚看完一个模型更新,还没消化完,下一个又来了。 除夕夜,本该是安安静静吃年夜饭的时间,大模型厂商却像打了鸡血一样—— 一个接一个更新,毫不客气。 “现在不是模型不够用,是我根本不知道该选哪个。” 一、先说个容易被忽略,但很关键的变化 最近 DeepSeek 的 APP 更新了版本,表面看是一次“小升级”,但其实很不简单。 两个变化,值得单独拎出来说: 第一,上下文直接拉到 100 万 Token。 这是什么概念? 以前你跟 AI 聊天,它像个短期记忆不好的人,聊多了就“忘前文”; 现在相当于你一次性把完整代码库、项目文档、甚至一本书丢给它,它还能从头看到尾。 这不是“更大数字”的问题,而是使用方式彻底变了。 第二,知识库时间线更新到 2025 年 5 月。 这几乎可以确定一件事: 背后已经不是老模型微调,而是新一代模型在路上了。 之前传闻说春节前后会有动作,现在基本算是实锤预热。 二、除夕夜最狠的一刀,来自阿里 如果说 DeepSeek 是“悄悄换了发动机”, 那阿里这波就是直接“换了车”。 除夕当天,阿里发布了新一代模型:千问 Qwen3.5-Plus。 很多人第一反应是: “又升级?我已经麻了。” 但这次不太一样。 几个点你只要记住一句话就够: 用不到一半的参数量,干翻了自家万亿级模型。 更夸张的是: 原生多模态(文字、图片、理解一起上) 推理吞吐最高提升 19 倍 API 价格低到离谱:百万 Token 只要几毛钱 说实话,这已经不是“技术炫技”,而是赤裸裸的工程和成本碾压。 现在很多团队,包括我们身边的一些真实项目,已经在用 阿里云 百炼的 API 把它接进生产系统。 不是因为情怀,是因为真省钱、真能跑。 三、国外这边也没闲着,Claude 继续加码 你以为国内卷完就结束了? 紧接着,Anthropic 发布了 Claude Sonnet 4.6。 这次更新没有新概念,也没有夸张营销,但很“工程师向”: 同样支持 100 万 Token 推理更稳,不爱胡编,也不瞎设计 电脑操作能力明显提升,复杂表格、多页面任务能一口气做完 关键是:价格没涨 现在你打开 claude.ai,免费用户用的就是新版本, Cursor、GitHub、Replit 这些工具也已经全部接入。 一句话总结: 它不是最便宜的,但是最“省心”的那一档。 四、所以问题来了:普通人到底该怎么选? 你预算充足、追求最稳的编程和推理体验 👉 Claude Opus / Sonnet 系列 你想让 AI 自己跑任务、做 Agent、长流程执行 👉 智谱 GLM-5 这种偏工程化的模型更合适 你想省钱,但又不想牺牲能力,尤其是多模态 👉 千问 Qwen3.5-Plus 是目前性价比最狠的选项之一 现在的现实是: 已经不存在“唯一最强模型”了。 谁更适合你的场景,谁就是最好的。 五、最后说句掏心窝子的 这一波更新,看着像“模型内卷”, 但对用户来说,其实是红利期。 上下文越来越大 成本越来越低 能力越来越接近真实“干活助手” 真正难的,反而不是模型不够强, 而是—— 你有没有想清楚,要用它来干什么。 模型会继续卷, 但会用的人,已经开始悄悄拉开差距了。