EF Core中Include、投影与跟踪策略的边界如何界定,是查询性能黑洞的根源吗?

摘要:很多团队把 EF Core 的性能问题归因于“ORM 天生慢”,但线上真实情况通常是: 查询写法对 SQL 形态不敏感 默认跟踪被滥用 图省事一次 Include 到底 结果是接口能跑,但高峰时段 P95 持续抬高,数据库 CPU 和网络带
很多团队把 EF Core 的性能问题归因于“ORM 天生慢”,但线上真实情况通常是: 查询写法对 SQL 形态不敏感 默认跟踪被滥用 图省事一次 Include 到底 结果是接口能跑,但高峰时段 P95 持续抬高,数据库 CPU 和网络带宽一起被拖上去。 这篇文章聚焦一个目标:把 EF Core 查询从“能查到数据”升级到“可预测、可解释、可优化”。 1. 问题背景:列表页为什么越改越慢 一个典型场景:订单列表页需要展示订单、客户、明细、商品。 最直觉的写法是连续 Include: var orders = await db.Orders .Include(o => o.Customer) .Include(o => o.Items) .ThenInclude(i => i.Product) .Where(o => o.CreatedAt >= from && o.CreatedAt < to) .OrderByDescending(o => o.CreatedAt) .Take(50) .ToListAsync(); 这段代码看起来“很完整”,但常见后果是: 结果集行数被笛卡尔放大 应用端做了大量重复对象反序列化和跟踪 实际只显示 6 个字段,却把整个对象图都拉回来了 2. 原理解析:EF Core 查询成本主要花在哪里 2.1 翻译成本 LINQ 先被转换为表达式树,再翻译成 SQL。复杂投影、方法调用、局部函数容易导致翻译退化或直接失败。 2.2 执行与网络成本 Include 深度越深,JOIN 越复杂,网络回包越大。很多慢查询不是数据库“算得慢”,而是“传得多”。 2.3 跟踪成本 默认跟踪模式会创建实体快照,便于更新,但纯读场景这部分是额外开销。 2.4 物化成本 即使 SQL 很快,应用层物化大量实体和导航属性也会抬高 CPU 与内存分配。 3. 示例代码:从全量实体到精准投影 先给出推荐的读模型查询写法: public sealed record OrderListItemDto( long Id, string OrderNo, string CustomerName, decimal TotalAmount, int ItemCount, DateTime CreatedAt); var query = db.Orders .AsNoTracking() .Where(o => o.CreatedAt >= from && o.CreatedAt < to) .OrderByDescending(o => o.CreatedAt) .Select(o => new OrderListItemDto( o.Id, o.OrderNo, o.Customer.Name, o.Items.Sum(i => i.Quantity * i.UnitPrice), o.Items.Count, o.CreatedAt)); var page = await query.Take(50).ToListAsync(); 对于高频、形态固定的查询,可以进一步使用编译查询: private static readonly Func<AppDbContext, DateTime, DateTime, int, IAsyncEnumerable<OrderListItemDto>> QueryOrderPage = EF.CompileAsyncQuery( (AppDbContext db, DateTime from, DateTime to, int take) => db.Orders .AsNoTracking() .Where(o => o.CreatedAt >= from && o.CreatedAt < to) .OrderByDescending(o => o.CreatedAt) .Select(o => new OrderListItemDto( o.Id, o.OrderNo, o.Customer.Name, o.Items.Sum(i => i.Quantity * i.UnitPrice), o.Items.Count, o.CreatedAt)) .Take(take)); var result = new List<OrderListItemDto>(); await foreach (var item in QueryOrderPage(db, from, to, 50)) { result.Add(item); } 如果确实需要多个集合导航,优先评估 AsSplitQuery(),避免单 SQL 被放大成巨型 JOIN。 4. 工程实践建议 4.1 明确“查询分层” 写模型:实体 + 跟踪,用于更新 读模型:DTO 投影 + AsNoTracking() 不要让一个查询同时承担“展示”和“更新”职责。 4.2 评审清单必须落地 每个新查询上线前至少确认: 是否只取了页面真正需要的字段 是否误用了默认跟踪 是否出现多集合 Include ToQueryString() 生成 SQL 是否可读、可控 4.3 慢查询排查顺序 先看 SQL 形态(是否放大) 再看索引命中 最后看 EF 物化和跟踪开销 这个顺序能避免在错误方向上“调 ORM 参数”。 4.4 建立基线 对核心查询做固定数据量压测,记录: 平均耗时 P95 每请求分配内存 数据库逻辑读 没有基线,优化结果只能靠感觉。 5. 总结 EF Core 查询优化的关键,不是“把 ORM 用得更花”,而是把查询职责拆清楚: 读取就投影 更新才跟踪 复杂对象图按需拆分 真正的工程收益来自可预测性。你能解释每一个查询为什么快,团队才敢在业务增长时持续演进。