【问题现象】
自2012年7月13日晚上开始,湖北省武汉市,孝感市部分无盘网吧出现客户机速度慢(===>>>白箭头,滚动条多,进入桌面时卡在正在加载个人设置时速度慢),上座率稍微高一些的时候客户机会出现游戏过程秒卡,聊天时QQ打字卡现象。
【原因说明】
此问题因湖北市文化监管软件造成大量回写,导致无盘服务器回写盘压力过大,最终出现客户机游戏过程秒卡、聊天时QQ打字卡等现象。
【解决方案】
网维大师用户可通过安全中心=>进程禁止功能,禁用BarClient.exe进程。
其他软件用户可采取其他方式将该进程禁用或将该程序卸载。但是最终解决办法还是建议联系软件厂商,协助软件厂商解决Bug,否则很容易被相关部门追查,这样就得不偿失了!
【问题分析】
之前有写过一篇文章,关于万象CallIE.exe异常出现可客户机回写量大的问题,导致QQ打字卡现象,文章链接:
万象CallIE.exe导致客户机上机一段时间后操作变“顿”,QQ打字都半天出来 - 死性不改's Blog~
http://www.clxp.net.cn/article.asp?id=2230
因此这次问题惯性思维就直接想到与回写有关,因为当事人反馈,之前都好好的,就是突然间有大量网吧出现问题,一般这种情况十有八九是有软件升级出了问题,导致回写量变大,进一步导致出现上面的问题现象。
接着进一步验证我的假设,看看是不是真的有程序导致回写量过大,然后在查看系统虚拟盘控制台客户机的回写量时发现,客户机回写量确实不小,如下图:
为了进一步确认确认是有软件在不停的回写,随便选了一台客户机开超级,也就是上图中有超级客户机状态的那台机器,发现开机57分钟,什么都不做,只开了一个ie和一个qq,结果直接回写了1025MB数据……基本上是证据确凿,假设的情况是确实存在的。
至此已经确定是回写过大导致出现问题,但是,是谁在回写呢???
在排查是哪个程序导致回写量大的时候,发现按照以往的方法去查看回写是看不的到任何数据的,但是你会在客户机看到网卡使用率一致有发送数据,同时系统虚拟盘看开超级的客户机也是一样在不停的回写。同时,用ProcessMon监控文件读写,也是什么都看不到,真实怪哉!
后来听到我的同事邓佳同学也在发问,这次问题很古怪,看到System一直在有回写,但是就搞不清楚是哪个程序在回写~于是按照他的说法用Processexplorer查看System进程,然后查看【磁盘和网络】选项卡的发送数据部分,发现果然是这样,如下图:
在逐一进程排查后,进一步分析得出结论,只要文化监管平台在运行状态,在查看System进程的磁盘IO时,发送字节量的数值就一致不停的变大,当用工具将文化软件的2个进程挂起时等待5~10秒左右,回写停止……当再恢复该程序运行后,回写继续!
经验表明,凡是之前一致正常,突然某一天出现大量网吧出现统一现象的问题时,基本上99%是由于某个软件升级导致,已经不是一次两次验证这个结论,面对这样的问题时,大家使用排除法就可以很快定位到问题,根据大家对工具的熟悉程度不同,只能是查的粗与细不一样,最终结果基本还是一样的。
同时,在无盘上,如果出现客户机打字都卡了,多数情况下还是和回写大有关系,因此出现该现象时,着重关注回写量是否真的很大,是否真的有程序在不停的回写,而方法也很简单,将客户机设置为超级用户,盯着无盘控制台看,看开超级的客户机是否一直不停的回写,如果是的话,就可以很直接的确定是因为客户机有程序在不停回写导致,然后用排除法,将可疑软件逐步卸载就ok了,总是可以轻松定位到问题的!