博客专栏

EEPW首页 > 博客 > 存储引发的故障

存储引发的故障

发布人：MCZH0904 时间：2020-10-10 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

现场如下图所示:

图片5.jpg

开始排查网络问题
在监控里面发现网络一直很稳定。而且如果是网络出现问题，同一网段的应用应该也都会报错才对。事实上只有对应的应用和中间件报错。

排查日志

发现一旦有中间件的register err 必定会出现中间件调用后端数据库的sql read timeout的报错。但这两个报错完全不是在一个线程里面的，一个是处理前端的Reactor线程，一个是处理后端SQL的Worker线程，如下图所示:

图片6.jpg

这两个线程是互相独立的，代码中并没有发现任何机制能让这两个线程互相影响。

进一步进行排查

和之前的慢SQL一样，都是调用第二个数据库超时，而DBA那边却说SQL执行没有任何异常，

图片7.jpg

感觉明显SQL执行有问题，只不过DBA是采样而且将采样耗时平均的，偶尔的几笔耗时并不会在整体SQL的耗时里面有所体现。

图片8.jpg

日志分析

从日志入手， REACTOR线程和Worker线程同时报错，但两者并无特殊的关联，说明可能是同一个原因引起的两种不同现象。在线上报错日志里面进行细细搜索，发现在大量的

NIOReactor-1-RW register err java.nio.channels.CloasedChannelException

日志中会掺杂着这个报错:

NIOReactor-1-RW Socket Read timed out

at XXXXXX . doCommit

at XXXXXX Socket read timedout

发现了端倪，Reactor作为一个IO线程，我们的中间件在处理commit/rollback这样的操作时候还是在Reactor线程进行的。很明显Reactor线程卡主是由于commit慢了

图片9.jpg

由于app1的commit特别慢而卡住了reactor1线程，从而落在reactor1线程上的握手操作都会超时！如下图所示:

图片10.jpg

为什么commit会变慢?

commit变慢所关联的DB正好也是出现慢SQL的那个DB。发现其中和存储相关的HBA卡有报错！如下图所示:

图片11.jpg

报错时间都是一致的！

推荐阅读：

明辰智航云安网络与虚拟化性能管理系统（www.mingczh.com）

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词：

相关推荐

如何用Altera器件实现延迟？

fanghlin | 2005-09-08

PCB打样回来，我们该怎么调？

EDA/PCB PCB 电路设计 | 2024-04-24

请教各位大侠：

taishij | 2005-09-08

汇总信号链中相关的射频计算器

模拟技术信号链 | 2024-04-24

迪思助力汽车和工业应用实现功能安全

| 2024-04-24

HI-TECH PICC库函数

资源下载 | 2007-02-09

37、CZX-18型显示器的电源电路图

设计方案 CZX-18 显示器电源电路图 | 2009-07-22

22、CASPER TM-5154HY型多频彩色显示器的电源电路图

设计方案 CASPER TM-5154HY 多频彩色显示器电源 | 2009-07-22

谁用ALTERA芯片做过读写RAM的控制？

sanhey | 2005-09-08

安富利Spartan-6 LX9 Microboard开发教程

视频 Xilinx Spartan-6 MicroBoard | 2011-08-12

TE Connectivity USB 3.0 连接器

视频 TE USB3.0 电脑消费数据通讯 USB 连接器相机数码 | 2011-08-08

Spansion最新65nm技术GL-S系列NOR闪存产品

视频 Spansion 闪存 | 2011-08-22

Altera的EPM7064SLC84-10求助

taishij | 2005-09-08

38、DARAS CH-5403V型单色显示器的电源电路图

设计方案 DARAS CH-5403V 单色显示器电源电路图 | 2009-07-22

Re: LCELL的延时有多大,大虾请出手!

sanhey | 2005-09-08

HT46R47R48R49R系列OTP单片机选型指南

资源下载 | 2007-02-09

华为将自动驾驶技术扩展应用于更多电动车型

汽车电子华为自动驾驶电动车 | 2024-04-24

特斯拉接近与LG新能源达成电极供应协议用于内部电池生产

电源与新能源电动汽车 LG 特斯拉 | 2024-04-25

GM16C550 串行端口扩展芯片

资源下载 | 2007-02-09

GD6829 可用单片机控制的单片视频编解码芯片

资源下载 | 2007-02-09

GMS 97C52单片机资料(中文)

资源下载 | 2007-02-09

36、CZX-14型显示器的电源电路图

设计方案 CZX-14 显示器电源电路图 | 2009-07-22

满意但不完美！华为首款Ultra旗舰Pura 70 Ultra全面评测

手机与无线通信华为 Pura 70 Iltra 测评 | 2024-04-24

输出电压调节

视频 Vicor 转换器输出电压 | 2011-07-29

安波福展示本地化软硬件解决方案让“软件定义汽车”照进现实

汽车电子安波福软件定义汽车 SVA 风河 | 2024-04-24

汇聚行业动能，英特尔发力共筑开放的AI软件生态

智能计算英特尔 AI软件生态 | 2024-04-24

TI永磁同步BLDC电机控制FOC控制方案演示

视频 TI永磁同步BLDC电机控制FOC控制方案演示 | 2011-08-24

Vishay推出饱和电流达230A的超薄汽车级IHDF边绕电感器

元件/连接器 Vishay IHDF 边绕电感器 | 2024-04-24

数字IC揭秘！DE/DV/DFT/PD都是啥？需要什么技能？

嵌入式系统数字IC | 2024-04-24

35、CTX-C1435型TTL和VGA多频彩色显示器的电源电路图

设计方案 CTX-C1435 多频彩色显示器电源电路图 | 2009-07-22

焦点

推荐视频

更多>>

技术专区

关闭