引言
蓝屏问题一直是个令人头疼的事情,但是往往我们遇到蓝屏,百度去搜索蓝屏代码时,我们会发现所有的蓝屏问题解决方案只有2点:1、硬件,2、驱动。于是我们就不停的换硬件排除,或者换硬件驱动排除,但事实上,对于蓝屏问题单纯的理解为硬件和驱动实际上有误导性的,为什么这么说?请看下文:
1、什么叫硬件问题引起蓝屏?
所谓的硬件蓝屏通常包含:硬件损坏、硬件不兼容、温度过高、接触不良、固件存在缺陷、供电不足等都属于硬件问题导致蓝屏,当然硬件蓝屏属于比较好处理的,因为一个“替换法”总是容易找到问题,但是遇到一些新硬件出现蓝屏时,往往很多人会认为,新硬件不会出现问题,结果去排查其它原因,可能折腾了几个星期,最终发现还是硬件问题,而此类案例也不再少数,而影响比较大的要属于以下几个问题:
- 希捷硬盘固件问题:硬盘用几天之后用HDTune检测,健康状态都是红色,使用过程中容易出现7E蓝屏。
- nVidia GTS250系列显卡BIOS问题:该显卡出场时BIOS就存在缺陷,以至于使用过程中出现各种蓝屏。
- AMD A55/A75系列主板BIOS供电问题:由于BIOS默认的出场设计电压不能满足100w版本的AMD641 CPU使用,导致容易出现蓝屏。
- 镁光Crucial m4 128G固态硬盘固件问题:使用5200小时后容易出现重启或蓝屏问题,最终被确认为固件问题。
所以这里也给大家一条建议,不要简单的认为,新的=好的,遇到问题时还是要认真排查才行,大胆怀疑,小心求证。
2、什么叫驱动问题引起蓝屏?
所谓的驱动问题导致蓝屏大家千万不要单纯的认为是显卡、声卡、网卡、主板等驱动才叫驱动,实际上软件也是包含驱动的,比如一些游戏的反外挂,都是带驱动的,那么游戏用驱动防护外挂,其实外挂也会使用驱动来强制破坏游戏,以实现作弊功能,比如cf多开外挂曾经就多次导致蓝屏,例如一些计费软件的防护驱动等等,这都属于驱动蓝屏。
就在近期,技术服务部通过对过去问题的受理数据分析发现,截止到目前为止,主要的蓝屏因素主要有以下几种原因构成,现在一起分享给大家,希望大家了解到以下信息后,可以更高效的处理蓝屏问题!
服务器蓝屏:
1、网卡驱动引起,典型蓝屏代码:0xD1、0x8E。
最近Windows 2008越来越流行(简称WS2008),这个操作系统在驱动改进层面做了非常棒的一点,那就是集成了较多硬件驱动,这本来是一件很好的事情,可以降低我们的工作量,但事实上我们发现,某些用户因为使用WS2008自带的网卡驱动,而出现较多服务器蓝屏问题。为此,我们提供了Intel网卡比较稳定的网卡驱动来供大家使用。
如果你的服务器使用的是intel服务器网卡,使用16.8.1版本的网卡驱动,稳定性将能得到较高保障,该驱动无论是在2003还是2008下,都可以发挥很好的效果,当然万兆网卡用它也非常不错。
下载地址:http://support.icafe8.com/drivers#network
2、服务器中毒引起,典型蓝屏代码:0x8E。
应该说服务器中毒问题在今天已经很少出现,但事实上少出现不代表不出现,在技术服务部受理的问题之中,有些用户反映服务器蓝屏则恰恰是因为服务器中毒导致,因为不多见,所以容易被忽略 ,以至于排查问题时间花费了很多,结果最后安装了杀毒软件扫描一下,发现是中毒了,清理病毒之后蓝屏现象消失,因此建议大家在服务器上安装轻量级防护软件,以策万全,这里我们推荐大家服务器上安装金山卫士,该款轻量级防护软件目前看来非常稳定个,且好用,推荐大家使用:http://www.ijinshan.com/ws/
3、服务器内存损坏引起,典型蓝屏代码:0x9C。
随着网维大师推出系统+虚拟盘方案,越来越多的用户认同这种大内存方案,但是大家在做方案时有时为了解决成本,或者不小心买到一些假内存,或者颗粒质量比较差的内存时,就比较容易出现因为内存故障导致的蓝屏问题了,不过通过数据分析发现,一般服务器内存导致蓝屏时,比较容易报告0x9C蓝屏,这为我们快速定位问题提供了有效依据,因此当大家遇到0x9C蓝屏时,可优先排除内存问题,当然也可以使用一款名为memtest的工具来测试内存是否正常,该工具可在本站下载到:http://support.icafe8.com/tools#hardwaretools
4、服务器硬盘故障引起,典型的蓝屏代码:0x7B、0x21a。
一般硬盘故障还是比较还定位的,因为硬盘出故障时,我们有较多的工具去检测它是否正常,比如HDTune,硬盘哨兵,MHDD等等,但有时候硬盘刚刚出现问题时,是不容易被检测出来的,此时如何判断硬盘是否有问题呢?方法很简单,假如是服务器的系统盘故障,那么会出现服务器系统响应迟钝的现象,比如启动一个程序要等很久,访问文件夹的响应速度也很慢,如果有此类现象,可能就要注意你的硬盘是否有问题了。假如是游戏盘、镜像盘、回写盘故障时,则比较容易出现系统虚拟盘、游戏虚拟盘程序容易崩溃的现象,此时也要关注下硬盘健康情况。
5、系统虚拟盘服务端软件版本过低导致,无典型蓝屏代码。
网维大师系统虚拟盘诞生于2010年4月份,由于软件初期存在一些Bug,较容易引起服务器或者客户机蓝屏,不过最终经过研发工程师们的努力,这些蓝屏问题目前都已经解决,因此如果你在使用网维大师系统虚拟盘,建议升级到2100或更高版本,蓝屏现象将会显著减少。大家可以到网维大师官网,下载中心下载最新版本的系统虚拟盘http://www.icafe8.com/frontEnd/product_common.jsp
客户机蓝屏:
与服务器蓝屏原因相比,客户机蓝屏原因可要复杂的多了,不过好在是我们可以通过不断的分析、总结来整理出蓝屏原因,公布给大家!
1、网维大师客户端温控组件兼容性问题引起,典型代码:0x50、0x03、0x8E。
2010年8月,网维大师7130发布,在这个版本中我们增加了客户机温控功能。因为硬件温度检测是需要了解每款硬件的BIOS温度传感器驱动接口,才能获取到硬件问题,因此我们与国际著名厂商“CPUID”公司合作,联合推出了温度监控功能,这一功能的加入,在用户口碑层面行程了良好的影响,但是也确实带来了不少麻烦,比如今天提到的蓝屏,由于该问题属于随机出现,且随机几率较低,所以整个解决过程较为漫长,在这个漫长的过程中也确实给广大用户带来了很多不良影响,因此在这里首先对因温控模块而出现蓝屏问题的用户道歉!同时也非常感谢广大用户的鼎立支持,正是因为大家的支持和厚爱,我们与厂商一起协力,最终解决了该问题。如果您的网吧有随机蓝屏问题,建议到网维大师官网下载最新的7170升级包进行升级,则可修复该Bug。
假如您使用的版本已经是7170,但是,是在8月22日前下载安装的,同样需要进行升级。最新的7170下载地址:http://www.icafe8.com/frontEnd/product_common.jsp
2、系统虚拟盘服务端软件版本过低导致,无典型蓝屏代码。
该问题已经在服务器蓝屏中提及,大家只需要按照服务器蓝屏的解决方案,将系统虚拟盘升级到最新的2100即可。
3、客户机显卡、声卡驱动问题引发的蓝屏,典型代码:0xEA、0x8E、0x0A、0x50。
这个蓝屏原因已经是老生常谈了,但为什么会一直有这样的问题呢?带着这个疑问,技术服务部的同事在出差协助客户解决问题时发现,越来越多的用户在安装系统时,使用驱动精灵、驱动人生一类的驱动安装工具来安装硬件驱动,当然,这本身并没什么问题,而有问题的是此类软件一般会自动下载版本较新的硬件驱动,因此大家在重做系统时可能会发现,上一个系统挺稳定的,为什么重做系统后就比较容易蓝屏?假如你是此类软件爱好者,那么就需要注意下驱动版本了!我们的建议是,重做系统时,先检查下网吧之前用的硬件驱动版本号,并记录好,假如之前的驱动比较稳定,强烈建议使用之前的驱动版本,尤其实在大家做新业务时,不要随便更换硬件驱动,以免做完系统存在诸多问题而导致丢单。
当然对于这个问题还有另外一个办法,就像技术服务部的工程师们一样,把一些比较稳定的驱动收集起来,这样在做系统时就不用去随便下载驱动,安装之后又引起“百花齐放”一般的蓝屏问题了。我们收集的驱动下载地址:http://support.icafe8.com/drivers
4、客户机使用360更新系统补丁后,系统留有360残留驱动引起。无典型蓝屏代码。
首先这里要澄清,以下言论并非恶意攻击360,只是因为使用360安装驱动,打补丁的人太多了,虽然大家都说360比较流氓,经常使用安全恐吓手段来诱使用户使用360产品,但事实上360某些功能确实不错,例如更新系统补丁、启动项管理、垃圾清理、IE插件清理等功能。有非常多的技术人员喜欢使用这个功能来更新系统补丁,然后大家使用完会采取卸载360的操作,大家认为卸载360之后就可以像没安装过360一样,但事实上,360自带的卸载工具并不能将360彻底卸载掉,就如同当年的3721插件一样,360卸载后,仍然有些核心驱动保留在系统中,这就引起了各种随机蓝屏问题,这里为大家提供一个360驱动卸载脚本,大家如果使用360更新系统补丁,可以在更新完补丁后,将360卸载并重启客户机,然后再使用脚本清理360驱动。
工具下载地址:http://support.icafe8.com/download/1499.html
5、交换机流量控制功能、网线质量,布线问题引发蓝屏,典型代码:0x7*(*代表任意字母、数字)
这个蓝屏原因也属于比较多见了。如交换机固件问题,最典型的就是H3C 5024P这款交换机,低版本的固件不仅存在性能问题,而且可能会引起网卡断开等问题,进而引发客户机随机蓝屏,上座率高了之后开机速度慢,游戏启动速度慢等问题。
交换机固件下载:http://support.icafe8.com/drivers#swfirmware
至于网线质量、水晶头氧化、网线与电源线部署在一起的案例就更加多见,这里就不多说了。但为什么这些问题会引发客户机随机蓝屏呢?其实这与无盘工作原理以及流量控制原理有关,简单的说就是无盘在读写数据时,因为流控或者网络质量问题,出现了数据丢包或者数据包损坏,就导致出现蓝屏问题了。当然解决方案也很简单,联系交换机厂商咨询是否有新固件,并且关闭交换机流控功能。假如老网吧的话,可能要多关注下水晶头老化,或者网线与电源线部署在一起的问题,适当的分开不只可提升稳定性,还能提升性能。
6、主板BIOS缺陷引起蓝屏,无典型蓝屏代码。
说到这里,不得不佩服网吧行业技术人员的坚强,又不得不慨叹网吧技术人员的艰难,一个蓝屏问题竟然涉及如此之多的领域……不过感慨归感慨,问题还是要说。
近1年来,硬件发展迅速,高端配置层出不穷,新技术就更是五花八门,百花齐放,让人们看的眼花缭乱,但硬件高速发展,可能因为稳定性把关问题出现,较多新型号主板均容易存在BIOS问题而导致游戏秒卡,甚至随机蓝屏问题。最为典型的是A55/A75主板BIOS存在问题的几率最高,这款主板BIOS出问题较多的原因主要与出场BIOS的参数设置有关,同时与该系列主板的新技术有关。案例就比比皆是了,大家可以通过查询各个主板的官方网站,来获取这些信息,这里以技嘉主板为例,之所以拿技嘉主板为例,主要是因为厂商比较诚实,乐于将问题公布出来,而不是将问题归咎于客户。看到下图,大家应该就可以明白为什么BIOS也会引发蓝屏了。
7、计费软件、文化软件、网维软件、第三方工具等引起蓝屏。
互联网经济时代,“广告”、“流量”等热门互联网业务成为了所有与网吧有关的软件必争的一部分收益点,因此在这个“战争”频发的时代,网吧客户机则成为了名副其实的“战场”,既然成为战场,那么损伤就是在所难免,而伤害比较大的则是蓝屏问题,此类蓝屏具备一个特点,那就是在你未做任何改动的情况下,突然出现大量蓝屏。假如你不去理会,通常3天之内问题肯定自然消失。这就是此类问题蓝屏的最大特点。
那么出现此类蓝屏问题时,到底该找谁求助呢?答案很简单,当然是谁的问题找谁解决……那如何判断是谁的问题导致的呢?俗话说的好,一个巴掌拍不响,往往此类蓝屏都会有2个责任方,因此这种蓝屏10次差不多有9次都是出现冲突导致的,也正是因为这样,此类蓝屏成为用户最为头疼的一种,因为它太无规律可言,且太不可控。
这里可以给大家一些问题定位建议:一般出现这种问题时,可采取拔掉计费软件、文化软件、网维软件服务器的网线,然后开机看是否还存在蓝屏问题,通过这种方法即可大致定位问题处在哪个平台上,而对于第三方软件判断就更加简单,将第三方软件卸载或删除,即可非常容易的定位蓝屏问题是否为此类软件导致。
至此,以上4000多字基本可以解决网吧内90%以上的蓝屏问题,当然今时今日是这些原因,随着软件、硬件、各类技术不断的蓬勃发展,相信导致蓝屏问题的因素会越来越多,因此这篇文章会不断更新,慢慢的增加案例,假如看这篇文章的你也感同身受,欢迎给我们投稿,我们将以您的名义公布信息,以表示对您的敬意!