专题:可观测性
共17篇相关文章

Linux系统中有哪些潜在暗坑需要特别注意?
TL;DR:conntrack 表满了、ARP 邻居表溢出、内核参数被静默重置、listen 队列丢包……这些 Linux 内核层的"沉默杀手"不会出现在你的 Grafana 大盘上,但能...

如何不依赖命令也能高效排障Catpaw Chat?
TL;DR:catpaw chat 让你用自然语言排障——说"最近有 OOM 吗",AI 帮你查 dmesg;说"谁在吃磁盘",AI 帮...

Serilog如何从结构化日志认知到.NET工程中完美落地?
问题背景 很多项目不缺日志,缺的是有用的日志。 平时接口跑得顺,大家都觉得日志够用。真到线上出问题,日志的短板会一下子暴露出来。 比如订单接口偶发超时,日志里只剩这么一句: Create order failed for customer...

Apache Parquet在日志处理中优势显著,其应用场景广泛吗?
写作背景 近期看了几篇关于日志解决方案的文章, 发现它们都在使用 Apache Parquet 作为存储文件格式. 如下: Yelp 发布大规模管理 S3 服务器访问日志的方案_架构_InfoQ精选文章 Cloudflare Log Exp...

为何Prometheus告警时,现场值总是无法获取?
Prometheus 生态已经成为新时代的监控标准,很多公司都用到了 Prometheus 生态的产品。在使用 Prometheus 过程中,经常有人困惑:为何在告警恢复时拿不到恢复时的值? 我们从原理来分析,帮大家解疑答惑。 Promet...

如何根据需求选择Zabbix和Prometheus监控系统?
经常收到网友提问,监控系统选型,到底应该选择 Zabbix 还是 Prometheus?本文谈一下个人看法,希望对你有所启发。 时代决定了基因 Zabbix 是 2001 年左右发布的,那个时代,微服务和 Kubernetes 都不盛行,Z...

夜莺监控架构模式有哪些详解?
对于 IT 的稳定性保障,越来越受到重视,据国外数据统计,监控、可观测性相关的支出大概占总体 IT 支出的 5%~8% 左右。CNCF 作为知名基金会,旗下最有名的项目当属 Kubernetes,其次两个重点项目 OpenTelemetry...

如何快速掌握最新极简Prometheus监控Kubernetes集群教程?
Kubernetes 是在生产中运行容器化工作负载的最流行的编排器。它为您提供了一套完整的工具,用于部署、扩展和管理容器。 不过,仅靠 Kubernetes 不足以运维应用程序。您还需要了解集群利用率、性能和发生的任何错误。 Prometh...

如何通过五步心法构建可观测性体系,实现业务洞见?
笔者做监控 11 年,在可观测性领域创业 4 年,与各类客户沟通较多,发现很多企业想要建设可观测性体系,但是不得章法,我把整个建设过程做了一个简单总结,梳理一下其中的脉络,希望对你有所启发。 整个可观测性体系建设,我总结为五个步骤: 明业务...

Grafana如何实现多数据源告警的全面可视化?
在监控、可观测性领域,Grafana 应该是使用最为广泛的开源项目了,Grafana 可以对接多种数据源,对其中的数据做可视化分析。 实际上,Grafana 也可以配置告警规则,只是设计上相对拧巴,用户用的比较少。因为大部分情况下,告警都是...

OpenTelemetry如何实现尾部采样疑问?
可观测性已成为维护系统健康和性能的关键要素。虽然传统的采样方法曾发挥过作用,但尾部采样的出现代表了我们处理追踪数据收集与分析方式的范式转变。这种智能采样策略正在彻底改变各组织处理遥测数据的方式,在优化存储成本和系统性能的同时,以前所未有的精...

如何设计夜莺监控系统,实现单进程或多进程,确保高可用性?
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 整体定位 了解一个开源项目,最应该了解的就是其定位,或者说它要解决的问题域。 夜莺的定位就是四个字:告警引擎。...

如何通过OpenTelemetry实现JMX监控的集成?
JMX 是什么? JMX 是 “Java Management Extensions” 的缩写,中文通常称为 “Java 管理扩展”。它是 Java 平台提供的一套标准框架,用于对 Java 应用程序、设备、系统资源进行监控和管理。 JMX...

夜莺监控设计思考:关于机器那些事儿,有哪些疑问?
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二...

夜莺监控告警原理及处理流程如何深度解析?
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二...
