Serilog如何从结构化日志认知到.NET工程中完美落地?

摘要:问题背景 很多项目不缺日志,缺的是有用的日志。 平时接口跑得顺,大家都觉得日志够用。真到线上出问题,日志的短板会一下子暴露出来。 比如订单接口偶发超时,日志里只剩这么一句: Create order failed for customer
问题背景 很多项目不缺日志,缺的是有用的日志。 平时接口跑得顺,大家都觉得日志够用。真到线上出问题,日志的短板会一下子暴露出来。 比如订单接口偶发超时,日志里只剩这么一句: Create order failed for customer 1024, cost 3800ms, trace abc123 这种日志平时看着还行,真到线上排障时基本帮不上太多忙: 你没法直接按 CustomerId、TraceId、ElapsedMs 做过滤和聚合,只能全文搜索 同一个字段今天写 customerId,明天写 userId,后天又换成 client_id,查询条件根本沉淀不下来 想统计某类错误的数量、平均耗时、失败占比,往往还得写额外脚本二次清洗 日志平台能做的分析能力很弱,因为它拿到的只是一段文本,不是一条可分析的数据 问题往往不在于日志打得不够多,而在于日志从一开始就没按可检索、可聚合、可关联的方式去设计。 传统文本日志更像写给人看的备注,结构化日志才像写给系统消费的数据。业务一旦进入多人协作、线上排障、统一观测这些阶段,日志就不再只是打出来看一眼,而是排障、审计、告警、指标补充、链路追踪的一部分。走到这一步,结构化日志就不是锦上添花,而是该补的基础课。 原理解析 什么是结构化日志 很多人第一次接触结构化日志,会下意识把重点放在 JSON 输出上。其实 JSON 只是表现形式,核心不在日志长什么样,而在日志里的字段有没有明确语义,后续能不能被系统稳定识别。 先看两种写法的差异。 普通文本日志: logger.LogInformation( $"Order {order.Id} created for customer {order.CustomerId}, amount {order.Amount}, cost {elapsedMs}ms" ); 这行代码最终只会产出一段字符串。人类看没问题,但日志平台拿到以后,并不知道哪一段是订单号,哪一段是金额,哪一段是耗时。 结构化日志: logger.LogInformation( "Order {OrderId} created for customer {CustomerId}, amount {Amount}, cost {ElapsedMs}ms", order.Id, order.CustomerId, order.Amount, elapsedMs ); 换成这种写法以后,日志框架记录的就不再是一整段普通字符串,而是一个日志事件: 模板是 Order {OrderId} created for customer {CustomerId}, amount {Amount}, cost {ElapsedMs}ms 属性是 OrderId、CustomerId、Amount、ElapsedMs 元数据还包括时间、级别、异常、来源、线程、TraceId 这些上下文 输出到控制台时,它可以渲染成人能直接看的句子;送到 Elasticsearch、Seq、Loki 或 OpenTelemetry 后端时,它又能以字段化数据的形式被检索和聚合。 所以,结构化日志本质上是事件加字段,不是把日志换个更漂亮的格式。 为什么需要结构化日志 结构化日志真正解决的,是文本日志进入工程化阶段以后暴露出来的几个硬伤。 1. 检索成本高 文本日志适合肉眼翻看,不适合机器分析。字段埋在句子里,检索通常依赖模糊匹配或者正则,成本高,也不稳定。 一旦日志天然带字段,排查动作会直接从翻文本变成查数据: 按 TraceId 找一条请求的全链路日志 按 OrderId 找某一笔订单的状态变化 按 StatusCode = 500 统计最近 10 分钟的异常峰值 按 ElapsedMs > 3000 过滤所有慢请求 这些动作放在文本日志里都挺别扭,放在结构化日志里反而是最基础的用法。 2. 字段不稳定,团队协作成本高 同一个业务含义,如果今天有人写 customerId,明天有人写 userId,后天又有人写 client_id,日志系统就很难形成稳定查询。 结构化日志还有一个很现实的价值,它会逼着团队把字段契约慢慢收敛下来,比如: TraceId 表示链路标识 OrderId 表示订单标识 UserId 表示当前登录用户 ElapsedMs 表示耗时,统一按毫秒记录 一旦字段稳定下来,排障脚本、监控规则、仪表盘、告警条件都能复用。 3. 无法自然接入可观测体系 现在的日志通常不会单独存在,而是要和指标、链路追踪一起工作。 如果你的日志里没有稳定字段,没有 TraceId、SpanId、RequestPath、StatusCode 这些上下文,日志和 tracing 就连不起来。最后经常会看到这种尴尬场景: 链路平台里能看到一个慢请求 日志平台里也有一条错误日志 但两边关联不上,只能靠时间戳人工猜 这就是结构化日志真正值钱的地方。它把日志从输出一段文本,抬到了沉淀一条可观测数据的层次。 为什么在 .NET 里很多团队选择 Serilog .NET 本身提供的是 Microsoft.Extensions.Logging 这一层日志抽象,它解决的是统一接口问题,但不直接决定你的结构化日志方案怎么落地。 真到工程落地这一步,很多团队会选 Serilog,原因大致有这几个: 它从设计上就是围绕结构化日志展开的,不是后来补上的能力 Message Template 语义成熟,字段模型清晰 Sink 生态完整,控制台、文件、Seq、Elasticsearch、OpenTelemetry 都有成熟支持 Enricher、Destructuring、过滤、分级控制这些能力适合长期跑在生产环境里 说得更严谨一点,Serilog 不是 .NET 里的唯一选项,但它确实是最常见、最成熟的结构化日志方案之一。 Serilog 到底做了什么 Serilog 的核心链路可以简化成下面这样: 应用代码 -> Message Template -> LogEvent -> Enricher 补充上下文 -> Sink 输出到 Console、File、Seq、OTLP 等目标 这里面最关键的是 LogEvent。它不是普通字符串,而是一个日志事件对象,里面至少会带上这些信息: Timestamp Level MessageTemplate Properties Exception 也就是说,你写下来的不再只是一句话,而是一份带上下文字段的事件数据。 再看最常见的这一行: Log.Information( "Payment {PaymentId} completed for order {OrderId}", paymentId, orderId ); Serilog 会把它拆成: 模板:Payment {PaymentId} completed for order 属性:PaymentId、OrderId 级别:Information 时间戳:当前时间 如果输出到 JSON Sink,日志后端看到的就是字段化结果,而不是一整段句子。 示例代码 从文本日志切到结构化日志 先看一种项目里很常见,但后面基本都会返工的写法: app.MapPost("/orders", async ( CreateOrderRequest request, OrderApplicationService orderService, ILogger<Program> logger) => { var startedAt = Stopwatch.GetTimestamp(); try { var orderId = await orderService.CreateAsync(request); var elapsedMs = Stopwatch.GetElapsedTime(startedAt).TotalMilliseconds; logger.LogInformation( $"Create order success, orderId={orderId}, customerId={request.CustomerId}, elapsed={elapsedMs}ms" ); return Results.Ok(new { OrderId = orderId }); } catch (Exception ex) { logger.LogError( ex, $"Create order failed, customerId={request.CustomerId}, totalAmount={request.TotalAmount}" ); return Results.Problem(); } }); 这段代码乍一看没什么问题,但后面会很难用,主要卡在两个点: 成功日志还是字符串拼接,字段无法稳定提取 同一类事件的字段命名没有固定模板,后续很难做查询和统计 换成结构化写法后,事情会简单很多: app.MapPost("/orders", async ( CreateOrderRequest request, OrderApplicationService orderService, ILogger<Program> logger) => { var startedAt = Stopwatch.GetTimestamp(); try { var orderId = await orderService.CreateAsync(request); var elapsedMs = Stopwatch.GetElapsedTime(startedAt).TotalMilliseconds; logger.LogInformation( "Create order succeeded. OrderId: {OrderId}, CustomerId: {CustomerId}, TotalAmount: {TotalAmount}, ElapsedMs: {ElapsedMs}", orderId, request.CustomerId, request.TotalAmount, elapsedMs ); return Results.Ok(new { OrderId = orderId }); } catch (Exception ex) { logger.LogError( ex, "Create order failed. CustomerId: {CustomerId}, TotalAmount: {TotalAmount}", request.CustomerId, request.TotalAmount ); return Results.Problem(); } }); public sealed record CreateOrderRequest(int CustomerId, decimal TotalAmount, List<int> ItemIds); 这里最关键的变化,不是把插值字符串替换成了占位符,而是字段终于稳定下来了。后面你在日志平台里按 CustomerId、OrderId、ElapsedMs 去查,就不会再陷入全文搜索。 在 ASP.NET Core 里接入 Serilog 下面给一个最常见的接入方式,示意代码基于 .NET 8。 先安装常用包: Serilog.AspNetCore Serilog.Sinks.Console Serilog.Sinks.File Serilog.Enrichers.Environment Program.cs 可以这样写: using Serilog; var builder = WebApplication.CreateBuilder(args); builder.Host.UseSerilog((context, services, loggerConfiguration) => { loggerConfiguration .ReadFrom.Configuration(context.Configuration) .Enrich.FromLogContext() .Enrich.WithMachineName() .Enrich.WithEnvironmentName() .Enrich.WithProperty("Application", "OrderService") .WriteTo.Console( outputTemplate: "[{Timestamp:HH:mm:ss} {Level:u3}] {Message:lj} {Properties:j}{NewLine}{Exception}" ) .WriteTo.File( path: "logs/order-service-.log", rollingInterval: RollingInterval.Day, retainedFileCountLimit: 14 ); }); builder.Services.AddProblemDetails(); var app = builder.Build(); app.UseSerilogRequestLogging(options => { options.MessageTemplate = "HTTP {RequestMethod} {RequestPath} responded {StatusCode} in {Elapsed:0.0000} ms"; }); app.MapGet("/orders/{orderId:int}", ( int orderId, ILogger<Program> logger) => { logger.LogInformation("Get order detail. OrderId: {OrderId}", orderId); return Results.Ok(new { OrderId = orderId, Status = "Paid" }); }); app.Run(); 这段配置做的事情其实很直接: 让 ASP.NET Core 默认日志管道接入 Serilog 自动把日志上下文写进去,比如环境名、机器名、请求上下文 同时输出到控制台和文件,便于开发和本地排查 用请求日志中间件统一记录 HTTP 请求,不用每个接口都手写一遍 Serilog 里最有价值的三个能力 1. Message Template 它决定了你的日志到底是不是结构化日志。 logger.LogInformation( "User {UserId} paid {Amount} for order {OrderId}", userId, amount, orderId ); 这里的 UserId、Amount、OrderId 都会变成独立字段。后续无论输出到文本、JSON 还是日志平台,这些字段都能继续保留下来。 2. Enricher Enricher 的价值很直接,就是把那些每条日志都想带上、但又不想在业务代码里重复传递的上下文统一补进去。 比如统一补充服务名、部署环境、节点名: loggerConfiguration .Enrich.WithProperty("Application", "OrderService") .Enrich.WithEnvironmentName() .Enrich.WithMachineName(); 如果要把 TraceId、TenantId、UserId 这类信息自动补到每条日志里,也通常是通过 Enricher 或 LogContext 完成。 3. Sink Sink 决定日志最后落到哪里。 常见选择包括: Console,适合本地开发和容器标准输出 File,适合简单部署或本地排查 Seq,适合结构化日志的快速查询和演示 Elasticsearch 或 Loki,适合接入中心化日志平台 OpenTelemetry,适合纳入统一可观测体系 Serilog 的优势不只是 Sink 多,而是这些 Sink 大多天然理解结构化字段,这一点在后续接日志平台时会省很多事。 记录复杂对象时怎么写 如果一个对象本身就带着明确的业务语义,可以直接让 Serilog 展开对象字段: logger.LogInformation("Submit order request: {@OrderRequest}", request); 这里的 @ 表示按对象结构展开,而不是只调用 ToString()。 适合的场景: 请求入参排查 领域事件快照 审计日志里记录业务对象摘要 但这里有个前提:对象里不能直接带密码、令牌、银行卡号这类敏感字段,或者至少要先做脱敏。 工程实践建议 1. 先设计字段,再写日志 如果把 Serilog 接进来了,日志也开始结构化了,最后还是不好查。问题通常不在框架,而在字段设计。 适用场景:准备给核心业务链路补日志时 建议: 先定一套高频字段名,比如 TraceId、UserId、OrderId、ElapsedMs、StatusCode 同一业务概念只保留一个命名,不要混着写 数值字段尽量保持真实数值类型,不要提前拼成字符串 注意事项:字段命名一旦被告警、仪表盘、查询脚本依赖,后面改动成本会很高。 2. 异常一定作为独立参数传入 错误日志里最容易踩的坑,就是把异常信息当普通字符串去拼。 错误写法: logger.LogError("Create order failed: {Exception}", ex.Message); 推荐写法: logger.LogError(ex, "Create order failed. OrderId: {OrderId}", orderId); 适用场景:所有异常日志 注意事项:异常对象独立传入后,堆栈、内部异常、异常类型才能被日志系统正确识别。 3. 不要默认记录完整请求体和响应体 如果你的团队为了方便排查,一上来就把请求体和响应体全量打进日志。短期看像是省事,后面大概率会变成新的问题源头。 适用场景:支付、用户、认证、订单等敏感业务接口 风险: 日志体积迅速膨胀 个人信息和敏感字段泄漏 序列化开销增加,请求延迟上升 建议:默认只记录关键摘要字段。确实要查 body 时,走白名单接口、临时开关或者采样策略。 4. 开发环境和生产环境的日志策略要分开 适用场景:同一套应用在本地、测试、生产都要运行 建议: 开发环境优先控制台可读性 生产环境优先结构稳定、便于平台采集 Debug 级别不要在生产环境长期开启 注意事项:日志级别过低、字段过多、输出目标过重,最后都会变成真实的性能成本。 总结 结构化日志解决的,从来都不是日志格式好不好看,而是日志能不能被系统稳定消费。 当日志开始承担排障、审计、告警、链路关联这些职责时,纯文本日志很快就会撞上天花板。结构化日志把日志从句子变成事件,把检索从全文搜索变成字段查询,这一步很关键。 在 .NET 生态里,Serilog 被大量团队采用,不只是因为它好用,更重要的是它把 Message Template、Enricher、Sink 这几层都做得比较成熟,能把结构化日志真正落到工程里,而不是停留在概念上。