1533625806953_28aeadd4_f9c8_4b76_8506_bd2ce62fcbcd

我的网站为什么一错再错

网页报错,尤其是5XX错误是互联网应用最常见的问题之一。5XX错误通常发生于服务端。服务端是业务逻辑最复杂,也是整条网络请求链路中最容易出错、出了错最难排查的地方。

运维工程师与研发工程师排查此类问题,通常要通过登录机器查看日志来定位问题。对于一般的Java应用错误日志,通常是这幅模样:

1533627938016_69333c17_98d0_4076_9931_b25ecac03303

一般来说,对于逻辑不算太复杂、历史不算“太悠久”的应用来说,登录机器看日志的方式能够很大程度上地解决网站报错的问题。但遇到下列情况时,使用传统的方式可能就有些困难:

  • 在一个分布式Java应用集群中,我想知道这类错误每分钟发生了多少次,什么时候开始发生的;
  • 系统太老,遗留异常我不想管了,我只想知道,今天和昨天相比,发布前和发布后相比,多了哪些异常;
  • 我想知道这个错误对应的是哪个Web请求,Web请求的参数是什么;
  • 客服给了我一个用户下单失
收藏 打印