跳过正文

Troubleshooting

解决 JVM Safepoint 延迟:从 EFS 集成到异步日志的探索之旅

解决 JVM Safepoint 延迟:从 EFS 集成到异步日志的探索之旅

·2317 字·5 分钟
深入调查升级到 Java 17 并实施 AWS EFS 集中式日志收集后出现的神秘 JVM safepoint 延迟问题。我们发现日志输出期间的文件 I/O 阻塞如何冻结整个 JVM 进程,并通过异步日志和正确的 WebFlux 实现解决了这个问题。
一个奇怪的 Bug 追踪:当异常失去声音时

一个奇怪的 Bug 追踪:当异常失去声音时

·1924 字·4 分钟
深入探讨一个神秘的生产问题,其中异常日志神秘消失,引导我们通过 Arthas 调试、Log4j2 内部机制,以及发现异常的 getMessage() 方法本身由于 Guava-Guice 版本不兼容而抛出异常。
通过 SQL 优化发现的隐藏生产问题

通过 SQL 优化发现的隐藏生产问题

·1800 字·4 分钟
当我们的运维团队带来一个执行时间极长的复杂 SQL 查询时,我们以为这只是一个性能问题。我们不知道,这次调查会发现一个深深隐藏的字符编码不匹配问题,它一直在我们的生产数据库中默默地导致全表扫描。