jaeger拓扑图为空的主因是reporter未配置、context未跨goroutine传播、servicename不唯一;需显式设置sampler与reporter,正确传递ctx,确保service name全局唯一且环境隔离。

Jaeger客户端初始化必须显式配置Reporter和Sampler
不配置就直接用jaeger.NewTracer,服务启动后根本不会上报Span,拓扑图永远为空——这不是bug,是Jaeger的设计逻辑:默认不发数据。
- 必须传入
jaeger.NewConstSampler(true)或jaeger.NewProbabilisticSampler(0.01),否则所有Span被静默丢弃 -
jaeger.NewUDPTransport的地址不能写"localhost:6831",容器内要换成Jaeger Agent服务名(如"jaeger-agent:6831"),否则DNS解析失败、UDP包静默丢失 - 如果用
jaeger.NewHTTPTransport(对接Collector),路径必须是"/api/traces",少斜杠或拼错会返回404且无日志提示
Context传递断裂导致Span链路中断
Go里context.Context不自动跨goroutine传播,HTTP handler里起新协程又没传ctx,拓扑图上就会突然断成两截——看起来像两个独立服务。
- HTTP handler中启动goroutine时,必须用
ctx := req.Context()再传进去,不能用context.Background() - 调用
http.Client.Do前,要用req = req.WithContext(ctx)把Span上下文注入请求,否则下游服务收不到uber-trace-id头 - 数据库操作(如
sql.DB.Query)需手动用opentracing.StartSpanFromContext续接,驱动本身不自动集成
ServiceName重复或未设置导致拓扑节点合并错误
多个服务共用同一个service name,Jaeger会把它们当成一个服务画节点;反过来,同一服务不同实例用了不同name,又会拆成多个孤立节点——拓扑图失真从这里开始。
-
jaegercfg.ServiceName必须全局唯一,推荐格式:"order-service-prod"(环境+服务名),别用"myapp"这种泛化名 - Kubernetes部署时,不要在代码里硬编码name,改用环境变量
os.Getenv("JAEGER_SERVICE_NAME"),配合Deployment的env字段注入 - 如果用了Istio Sidecar自动注入,且同时启用了应用层Tracing,要关掉Istio的
tracing策略,否则Span会被重复采样、时间戳错乱
Span Tag漏加关键标识影响拓扑分组
拓扑图默认按service.name + operation.name聚合边,但如果你没打http.url、db.statement这类Tag,所有HTTP调用都显示为GET /,根本看不出调了哪个下游。
立即学习“go语言免费学习笔记(深入)”;
- HTTP handler里务必加:
span.SetTag("http.url", req.URL.String())和span.SetTag("http.method", req.Method) - 调用gRPC时,用
grpc-go的otgrpc.OpenTracingServerInterceptor,它会自动补grpc.method等Tag;自己手写client请手动span.SetTag("grpc.method", ...) - 避免在Tag里塞敏感信息(如
user.id明文),Jaeger UI默认暴露全部Tag,生产环境建议只留诊断必需字段
真正卡住拓扑生成的,往往不是SDK集成那几行代码,而是Reporter连通性、Context传播完整性、ServiceName一致性这三个点——漏查一个,图就画歪了。










