在 async-http-client 回调中执行 JSON 解析,为何会拖垮整个服务?作者:九师兄发布时间:2026年02月05日问题引入:一次“看似无害”的埋点上报引发的雪崩某电商大促前夜,监控告警突响:用户行为埋点上报服务(Flink 实时作业)延迟从 200ms 飙升至 15s,Kafka 消费 Lag 累积超百万条。该服务负责将 Kafka 中的点击流事件通过 async-http-client 异步发送至数据中台 API。初步排查:Flink TaskManager CPU 使用率仅 30%,但Netty EventLoop 线程 CPU 占用高达 98%日志中频繁出现"JSON parse took 12ms"(我们加的埋点)jstack显示大量线程阻塞在com.fasterxml.jackson.databind.ObjectMapper.readValue()网络连接数正常,无明显 GC 停顿# jstack 关键片段