请选择 进入手机版 | 继续访问电脑版

老米之家

 找回密码
 立即注册
查看: 101|回复: 0

网站故障排查从错误码406说起

[复制链接]

2961

主题

2961

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
11309
发表于 2022-5-20 08:27:50 | 显示全部楼层 |阅读模式
网站故障排查怎么做?我们首先判断,从故障现象来看,应该和后端无关,而是与前端有关,所以我们迅速查看了前端的日志,从日志来看,主要是用于判断客户端的地理位置接口持续出现错误,出现大量的HTTP Status Code 406(24小时之内出现了1w多条)。
按照HTTP Status Code的规范,4开头的错误码和客户端有关,考虑到这个故障只出现在一位老师那里,初步判断406就是问题的根源。随着掌握信息的增加,分析的加深,我们迅速解决了那位外教的故障,不幸的是,确认它和406没有关系。但是,我们并不能就此打住。毕竟正常情况下响应的HTTP Status Code应该是200,那么大量的406到底是什么呢?为什么我们都无法复现?它们是如何引发的?如此大量的爆发应当引起用户的反馈了?为什么线上的反馈这么平静呢?排查过程为了保障性能,我们的 Node 端并没有详细记录每个请求,所以单纯看406的日志并不能知道具体的原因。为了排查这个问题,我们紧急发布了在线补丁,具体记录每个请求的详细信息,然后在日志平台中看到了下面的请求。于是,我们在 Postman 中模拟了错误的请求,果然,我们复现了406错误,所以可以确认问题是 Accept 字段导致。406 Not Acceptable 状态码表示客户端错误,表示请求的资源的内容特性无法满足请求头中的条件,因而无法生成响应实体。 译自HTTP协议规范RFC文档我们上网查阅资料并也跟后端同事讨论了406的错误码,得知,如果请求头的 Accept 不符合事先约定的契约,就会返回406错误。报错的是 API 服务,返回的是 application/json 格式的数据, 然而请求中的 Accept 说明它并不支持这种格式,所以会报出406错误。我们仔细检查了常见浏览器发送的请求,发现全部都包含 Accept: */* ;。看来,这些引发406的请求并不是普通用户发出来的。那么,究竟是谁发出了这些请求呢?难道是CDN?CDN 的全称是Content Delivery Network,即内容分发网络。 其目的是使用户可就近取得所需内容,解决Internet网络拥挤的状况,提高用户访问网站的响应速度。 CDN 网络可以将服务器的内容缓存到分布全球的CDN节点,根据用户的访问 IP,就近连接 CDN,提高网站响应速度。(引用自google.com)以上就是小编对于网站故障排查的解析。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|老米之家 ( 蜀ICP备2021018398号-10 )|网站地图

GMT+8, 2022-12-8 20:33 , Processed in 0.049787 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表