云原生可观测性三大支柱是日志、指标和追踪。1. 日志记录系统事件,用于审计与故障回溯,常用工具包括Fluentd、Loki和Elasticsearch;2. 指标量化系统状态,支持监控与告警,典型工具有Prometheus、Telegraf和Grafana;3. 追踪揭示请求在分布式系统中的路径,助力性能优化,主流方案有Jaeger、OpenTelemetry和Zipkin。三者结合可全面掌握应用运行状态,提升系统稳定性与可维护性。

云原生中的可观测性三大支柱是日志(Logging)、指标(Metrics)和追踪(Tracing)。它们共同帮助开发者和运维人员理解系统行为、排查问题并优化性能。
1. 日志(Logging)
日志是系统在运行过程中产生的结构化或非结构化的文本记录,用于记录事件的发生,比如错误信息、用户操作或服务启动过程。
特点与用途:
- 每条日志通常包含时间戳、级别(如info、error)、来源和服务上下文
- 适合用于审计、故障回溯和安全分析
- 常见工具包括 Fluentd、Loki 和 Elasticsearch
2. 指标(Metrics)
指标是对系统状态的量化测量,通常是数值型数据,按时间序列进行采集和存储。
典型应用场景:
- 监控CPU使用率、内存占用、请求延迟、QPS等
- 支持告警设置和趋势分析
- 常用工具如 Prometheus、Telegraf 和 Grafana
3. 追踪(Tracing)
追踪关注的是请求在分布式系统中流动的完整路径,帮助识别性能瓶颈和调用依赖关系。
关键作用:
- 展示一次请求经过的各个服务节点及耗时
- 定位慢调用、超时或失败的根本原因
- 主流实现有 Jaeger、OpenTelemetry 和 Zipkin
基本上就这些。通过整合日志、指标和追踪,可以全面掌握云原生应用的运行状况,提升系统的稳定性和可维护性。










