您是否会有这样的感觉:即使电脑里装有安全软件,可垃圾邮件依然定期而至,我行我素?是的,为了躲避对垃圾邮件过滤器的检测,垃圾邮件变得越来越“狡猾”了。垃圾邮件发布者经常会发布含有图片的垃圾邮件,为了让检测更加困难,他们还经常在垃圾邮件背景图片中添加复杂的干扰图形,打乱字母的几何形状,利用干扰帧和线条分割信息内容,让众多安全软件防不胜防。不过令人高兴的是,这一情况有望得到彻底改善。近日,全球知名的反病毒厂商—卡巴斯基实验室成功地为其“光栅图像垃圾邮件识别技术”申请到了专利,这也预示着在不久的将来,狡猾的图片垃圾邮件将无所遁形。
我们知道,大部分安全软件要识别图片中的文字,都会采用传统的光学字符识别(OCR)方法。但是,这种识别方法资源占用大,而且识别水平不够高,容易出现漏网之鱼。基于这种状况,卡巴斯基实验室反垃圾邮件技术组组长Evgeny Smirnov经过潜心研究,成功开发出专门针对图片垃圾邮件的“光栅图像垃圾邮件识别技术”,并于2010年4月27日被美国专利与商标局分别授予两项专利,专利号分别为:Nos. 7706613 和 7706614。而就在几天后的5月4日,美国专利与商标局又向此技术的改进版授予了专利号为No. 7711192的技术专利,这版改进的图片垃圾邮件识别技术整合了优化的对象隔离功能,使得对象更容易被识别出来,并且加强了垃圾邮件过滤能力。
据了解,卡巴斯基实验室光栅图像垃圾邮件识别技术的核心是一套基于概率研发出的算法,它能利用数据分析计算某个图像是否包含文字信息,并仔细分析图片的特征,运用算法确定图片中包含可读文字信息的内容。同OCR识别比起来,它能更加快速精确地检测出包含于图片中的垃圾信息,并能轻易识别专门用于干扰文字信息的图片,对变形文字同样有效,大大提高了对垃圾邮件的检测水平。
卡巴斯基实验室首席知识产权顾问Nadezhda Kashchenko对这项专利技术赞扬道:“机械手段识别需要识别对象必须尺寸一致,排列有序。但是,我们最新的技术却能够识别各种弯曲的、扭曲的字母或单词,极大地提高了检测准确率。新取得专利的这项技术大大提高处理图片内容的速度。”
看来垃圾邮件发布者的“好日子”已经不长了。当然,我们也毫不怀疑他们会绞尽脑汁想出更多伎俩躲避安全软件的追查。但可以肯定的是,卡巴斯基实验室技术更新的脚步绝不会停止,除上述专利外,卡巴斯基实验室目前仍有超过50项技术正在美国、俄罗斯、中国以及欧洲申请专利权,只要卡巴斯基实验室存在一天,相信网络威胁制造者的日子就绝不会好过。